Анализ связи ранжированных рядов. Как сделать ранжированный ряд в excel


Ранжирование – процедура упорядочивания любых объектов по возрастанию или убыванию некоторого их свойства при условии, что они этим свойством обладают.

Можно ранжировать:

Государство по уровню жизни, рождаемости, безработице;

Профессии по престижности;

Товары по предпочтению потребителей;

Респондентов по политической активности, материальному положению;

Объектами ранжирования являются те объекты, которые непосредственно упорядочиваются. Основание ранжирование (ранжирующий признак) – то свойство, по которому объекты упорядочиваются. В результате ранжирования получаем ранжированный ряд, в котором каждому объекту приписывается свой индивидуальный ранг – место объекта в ранжированном ряду. Число мест и, соответственно, число рангов в ранжированном ряду равняется числу объектов.

Виды ранжированных рядов:

1) каждый объект имеет значение признака, отличное от значений признака других объектов, тогда каждому объекту ранжированного ряда присваивается свой, отличный от другого объекта, ранг;

2) несколько объектов имеют одинаковое значение признака, тогда этим объектам в ранжированном ряду присваивается одинаковые ранги, рассчитанные по определенной формуле. В этом случае ранжированный ряд называется ранжированным рядом со связанными рангами. При решении задач первый ранг будем присваивать наибольшему значению признака. Связанный ранг рассчитывается как среднее значение мест, занимаемых объектами, имеющими одинаковое значение признака. Установление статистической связи для 2-х и более ранжированных рядов осуществляется с помощью ранговых коэффициентов связи – такие коэффициенты, которые позволяют вычислять степень согласованности в ранжировании одних и тех же объектов по двум различным основаниям (признакам). Наиболее распространенным коэффициентом ранговой связи (ранговой корреляции) является коэффициент ρ-Спирмена.

Допустим, что н объектов упорядочены по признаку х и по признаку у. Пусть

Мера несовпадений рангов i-того объекта: d i = R x i - R y i

Свойства:

Изменяется в интервале от -1 до 1;

Ро = 1, если наблюдается полная согласованность ранжированных рядов; ранги одного и того же объекта по двум признакам совпадают.

Ро = -1, если полная несогласованность ранжированных рядов; такая ситуация возникает, если ранговые ряды имеют обратное направление: R x i – 1 2 3 4 5; R y i – 5 4 3 2 1.

Замечание: может рассчитываться для двух видов равных (если каждый объект свой ранг и если имеются связанные ранги).

Проверка гипотезы о статистической значимости коэффициента ρ-Спирмена.

H 0: ρ гс = 0

H 1: ρ гс ≠ 0

Нулевая гипотеза всегда утверждает, что ρ равен 0. Альтернативная – что значение ρ отлично от 0.

Уровень значимости как в таблицах сопряженности.

Государство А Б В Г Д Е Ж З И
Качество жизни 6,8 7,0 6,5 5,9 4,6 5,7 4,5 5,8 4,0
Безработица 20,3 18,0 19,8 23,4 21,6 20,8
Ранг x
Ранг y
|d i |
d 2 i
Σ d 2 i

τ -Кендалла – разность между вероятностями правильного и неправильного порядка для двух наблюдений, извлечённых из совокупности случайно при условии, что связанные ранги отсутствуют. Свойства:

Изменяется от -1 до 1;

Если признаки х и у статистически независимы, то коэффициент τ обращается в 0; если τ равен 0, еще не значит, что признаки статистически независимы;

Если τ равен 1, это значит, что между признаками имеется полная прямая статистическая связь или ранжированные ряды полностью согласованы; если τ равно -1, это значит, что присутствует полная обратная статистическая связь, или ранжированные ряды являются несогласованными.

S – общее число пар объектов с согласованным правильным порядком по обоим объектам. D – общее число пар объектов с несогласованным неправильным порядком по обоим объектам.

Проверка гипотезы о статистической значимости коэффициента τ:

H 0: τ гс = 0

H 1: τ гс ≠ 0

Коэффициент τ является статистически значимым, если его значения для ГС отлично от 0.

|Z H | > Z кр => H 1

Если ранжированный ряд построим для малого числа объектов, то подтверждение нулевой гипотезы нам говорит о том, что нужно изучить большее количество объектов.

Если изучено достаточное количество объектов, то подтверждение нулевой гипотезы говорит о том, что связь между признаками отсутствует.

Множественный коэффициент ранговой связи

Применяется в тех случаях, когда необходимо измерить связь между более чем 2 ранжированными рядами (например, когда мы хотим оценить согласованность мнений экспертов (более 2) при оценке 1 и тех же объектов).

S – сумма квадратичных отклонений значений рангов по строке от среднего ранга для всей совокупности. k 2 – число переменных (число экспертов). n – число ранжируемых объектов.

Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.

Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).

Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным . Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).

Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Другие формы вариационного ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.

Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.

Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака.

Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд .

Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота).

Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается

где k - число вариантов значений признака

Очень часто таблица дополняется графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение.

Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.:

При построении вариационного ряда с интервальными значениями прежде всего необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп m:

где R = xmax - xmin ; m = 1 + 3,322 lgn (формула Стерджесса); n - общее число единиц совокупности.

Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода, или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном вариационном ряду.

Медиана (Ме) - это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда.

Для ранжированного ряда с нечетным числом индивидуальных величин (например, 1, 2, 3, 3, 6, 7, 9, 9, 10) медианой будет величина, которая расположена в центре ряда, т.е. пятая величина.

Для ранжированного ряда с четным числом индивидуальных величин (например, 1, 5, 7, 10, 11, 14) медианой будет средняя арифметическая величина, которая рассчитывается из двух смежных величин.

То есть для нахождения медианы сначала необходимо определить ее порядковый номер (ее положение в ранжированном ряду) по формуле

где n - число единиц в совокупности.

Численное значение медианы определяют по накопленным частотам в дискретном вариационном ряду. Для этого сначала следует указать интервал нахождения медианы в интервальном ряду распределения. Медианным называют первый интервал, где сумма накопленных частот превышает половину наблюдений от общего числа всех наблюдений.

Численное значение медианы

где xМе - нижняя граница медианного интервала; i - величина интервала; S-1 - накопленная частота интервала, которая предшествует медианному; f - частота медианного интервала.

Модой (Мо) называют значение признака, которое встречается наиболее часто у единиц совокупности. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой.

Чтобы найти конкретное значение моды, необходимо использовать формулу

где xМо - нижняя граница модального интервала; iМо - величина модального интервала; fМо - частота модального интервала; fМо-1 - частота интервала, предшествующего модальному; fМо+1 - частота интервала, следующего за модальным.

Мода имеет широкое распространение в маркетинговой деятельности при изучении покупательского спроса, особенно при определении пользующихся наибольшим спросом размеров одежды и обуви, при регулировании ценовой политики.

Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда. При попытке изображения этих данных графически мы получим некоторую плавную кривую линию, которая для полигона частот будет являться некоторым пределом. Эту линию называют кривой распределения.

Иными словами, кривая распределения есть графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, которое функционально связано с изменением вариант. Кривая распределения отражает закономерность изменения частот при отсутствии случайных факторов. Графическое изображение облегчает анализ рядов распределения.

Известно достаточно много форм кривых распределения, по которым может выравниваться вариационный ряд, но в практике статистических исследований наиболее часто используются такие формы, как нормальное распределение и распределение Пуассона.

Нормальное распределение зависит от двух параметров: средней арифметической и среднего квадратического отклонения . Его кривая выражается уравнением

где у - ордината кривой нормального распределения; - стандартизованные отклонения; е и π - математические постоянные; x - варианты вариационного ряда; - их средняя величина; - cреднее квадратическое отклонение.

Если нужно получить теоретические частоты f" при выравнивании вариационного ряда по кривой нормального распределения, то можно воспользоваться формулой

где - сумма всех эмпирических частот вариационного ряда; h - величина интервала в группах; - cреднее квадратическое отклонение; - нормированное отклонение вариантов от средней арифметической; все остальные величины легко вычисляются по специальным таблицам.

При помощи этой формулы мы получаем теоретическое (вероятностное) распределение , заменяя им эмпирическое (фактическое) распределение , по характеру они не должны отличаться друг от друга.

Тем не менее в ряде случаев, если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии (), такой ряд выравнивается по кривой Пуассона.

Кривую Пуассона можно выразить отношением

где Px - вероятность наступления отдельных значений х; - средняя арифметическая ряда.

При выравнивании эмпирических данных теоретические частоты можно определить по формуле

где f" - теоретические частоты; N - общее число единиц ряда.

Сравнивая полученные величины теоретических частот f" c эмпирическими (фактическими) частотами f, убеждаемся, что их расхождения могут быть весьма невелики.

Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.

Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.

Наиболее распространенным является критерий согласия К. Пирсона , который можно представить как сумму отношений квадратов расхождений между f" и f к теоретическим частотам:

Вычисленное значение критерия необходимо сравнить с табличным (критическим) значением . Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m - 3, где m - число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n 50), при этом если в некоторых интервалах теоретические частоты < 5, то интервалы объединяют для условия > 5.

Если , то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.

В том случае, если отсутствуют таблицы для оценки случайности расхождения теоретических и эмпирических частот, можно использовать критерий согласия В.И. Романовского КРом, который, используя величину , предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения

где m - число групп; k = (m - 3) - число степеней свободы при исчислении частот нормального распределения.

Если вышеуказанное отношение < 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение > 3, то расхождения могут быть достаточно существенными и гипотезу о нормальном распределении следует отвергнуть.

Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле

где D - максимальное значение разности между накопленными эмпирическими и теоретическими частотами; - сумма эмпирических частот.

По таблицам значений вероятностей -критерия можно найти величину , соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны.

Необходимым условием при использовании критерия согласия Колмогорова является достаточно большое число наблюдений (не меньше ста).

Понятие сводки, группировки, классификации

Сводка – систематизация и подведение итогов: метеосводка, сводка с полей. Сводка не позволяет детально проанализировать информацию. Любая сводка должна опираться на группировку данных, т.е. сначала группировка, а потом сводка данных.

Группировка – разделение совокупностей на ряд групп по наиболее существенным признакам.

Различают качественную и количественную группировку. Качественная – атрибутивная, количественная – вариационная. В свою очередь вариационная делится на структурную и аналитическую. Структурная группировка предполагает расчет удельного веса каждой группы. Пример: на предприятии 80% - рабочие, 20% - служащие, из них 5% - руководители, 3% - служащие,12% - специалисты. Цель аналитической группировки – выявить взаимосвязь между признаками: стажем работы и средним заработком, стажем и выработкой и другими.

При проведении группировки необходимо:

Проведение всестороннего анализа природы изучаемого явления;

Выявление группировочного признака (одного или нескольких);

Установить границы групп таким образом, чтобы группы существенно отличались друг от друга, и в каждой группе объединялись однородные элементы.

По степени сложности группировки могут быть простые и комбинационные (по признакам).

По исходной информации различают первичную и вторичную группировки, первичная осуществляется на основе исходных данных наблюдения, вторичная использует данные первичной группировки.

Количество групп определяется по формуле Стерджесса:

где n - количество групп, N – генеральная совокупность.

Если используются равные интервалы, то величина интервала равна .

Интервалы могут быть равные и неравные. Последние, в свою очередь, делятся на изменяющиеся по закону арифметической или геометрической прогрессии. Первый и последний интервалы могут быть открытые или закрытые. Закрытые интервалы включают или не включают границы интервала.

Если интервалы закрытые, и ничего не сказано о включении верхних границ, то считаем, что верхние границы включены.

Если интервалы открытые, то ориентируемся по последнему интервалу.

Признак в этих интервалах может измеряться дискретно и непрерывно (т.е. дробиться). При непрерывном признаке границы смыкаются 1- 10, 10 - 20, 20 – 30; если признак изменяется дискретно, то можно использовать следующую запись: 1 – 10, 11 – 20, 21 – 30.

Если интервалы открытые, то величина последнего интервала приравнивается к предыдущему, а первого - ко второму.

Классификация – группировка по качественному признаку. Она относительно устойчива, стандартизирована и утверждается органами государственной статистики.


3.2. Ряды распределения: виды и основные характеристики

Под рядом распределения понимается ряд данных, характеризующих какое-либо социально-экономическое явление по одному признаку. Это простейший вид группировки по двум признакам.

Ряды распределения делятся на качественные и количественные, на ранжированные и не ранжированные, на сгруппированные и не сгруппированные, с дискретным и непрерывным распределением признака.

Примером не сгруппированного, не ранжированного ряда по заработной плате является ведомость заработной платы. В то же время, список работников может быть ранжированный по алфавиту или по табельным номерам. Примером ранжированного ряда является список команд, рейтинг теннисистов.

Ранжированный ряд распределения - ряд данных, расположенных в порядке убывания или возрастания признака.

Для сгруппированных ранжированных рядов выделяют следующие характеристики: варианту, частоту или частость, кумуляту и плотность распределения.

Варианта () – среднее интервальное значение признака. Т.к. при создании группировки должен выполняться принцип равномерного распределения признака в каждом интервале, то варианту можно рассчитывать как полусумму границ интервалов.

Частота () показывает сколько раз встречается данное значение признака. Относительное выражение частоты представляет собой частость (.) , т.е. долю, удельный вес от суммы частот.

Кумулята () – накопленная частота или частость, расчет нарастающим итогом. Кумулятивно подсчитываются объем, затраты, доходы, т.е. результаты деятельности.

Таблица 1

Группировка действующих кредитных организаций
по величине зарегистрированного уставного капитала

в 2008 году в РФ

Под группировкой в статистике понимают расчленение статистической совокупности на группы, однородные в каком-либо существенном отношении, характеристику выделенных групп системы показателей в целях выделения типов явлений, изучение их структуры и взаимосвязи. В процессе сводки первичного материала явления разделяются на группы по различным варьирующим признакам.

Варьирующий признак - это признак, принимающий различные значения у отдельных единиц совокупности.

Задачи, стоящие перед группировкой:

1. Выделение в составе массового явления тех его частей, которые однородны по качеству и условиям развития, и в которых действуют одни и те же закономерные влияния факторов;

2. Изучение и характеристика структуры и структурных сдвигов в исследуемых совокупностях;

3. Влияние взаимосвязи между отдельными признаками изучаемого явления.

Главным вопросом метода группировок является выбор группировочного признака, от правильного выбора которого зависят результаты группировки и всей работы в целом.

После отбора группировочного признака важно разделить единицы совокупности на группы.

Выделенные группы должны быть качественно однородными, а также иметь достаточно большую численность единиц, что позволит проявить типичные черты, свойственные массовым явлениям. Поэтому большое внимание уделяется определения числа групп и их границ. При решения этого вопроса учитывают вид группировки, характер группипровочного признака и задачи исследования.

Сгруппируем хозяйства. За группировочный признак возьмем удой от одной коровы, в кг. По уровню молочной продуктивности наблюдается большое различие в хозяйствах данной зоны. Этот признак колеблется в

С помощью метода статистической группировки различным различия между хозяйствами по уровню молочной продуктивности коров.

Первым этапом работы является построение ранжированного ряда. В ранжированном ряду все величины расположены по нарастанию или убыванию группировочного признака.

Ранжированный ряд показывает интенсивность изменения величины пределах от 1364 до 6270 кг. группировочного признака, по нему можно установить резкие переходы и выделить очень сильно отличающиеся по величине признака единиц.

Для составления ранжированного ряда используем данные молочной продуктивности коров в хозяйствах Ачинской зоны за 2003 г.

Результаты оформим в таблице 2.1.

Таблица 2.1.

Название хозяйства

Удой от 1 коровы в год, кг

ЗАО«Белоозерское»

ЗАО « Шарыповское»

САО «Ивановское»

ЗАО «Оракское»

АО «Сахаптинское»

СЗАО «Анашенское»

ЗАО «Энергетик»

СЗАОТ «Бараитское»

СЗАОТ «Игрышенское»

СХПК «Белоярский»

АОЗТ «Павловское»

АОЗТ «Ададымское»

АО «Краснополянское»

АОЗТ «Дороховское»

АО «Гляденское»

СХАОЗТ «Легостаевское»

ЗАО «Алтайское»

ЗАО «Светлолобовское»

АОЗТ «Подсосенское»

АОЗТ «Крутоярское»

ТОО п/з « Ачинский»

ЗАО «Авангард»

ОАО «Малиновский»

САОЗТ «Навоселовское»

АОЗТ «Назаровское»

Для большей наглядности изобразим ранжированный ряд графически, для чего построим огниву Галь тона.

Для этого на оси абсцисс расположим в порядке возрастания группировочного признака, а по оси - величину молочной продуктивности коров, соответствующий хозяйству, рис.2.1.

Ранжированный ряд хозяйств по уровню молочной продуктивности коров.

Проанализируем данные ранжированного ряда и его графика - оценим характер и интенсивность различий между хозяйствами и попытаемся выделить существенно отличные группы хозяйств. Между хозяйствами имеются существенные различия в уровне молочной продуктивности коров: размах колебаний составляет 6270 - 1364 = 4906 кг от 1 коровы, а уровень производства молока в хозяйстве №25 выше, чем в №1 в 4,6 раза (6720/1364).

Возрастания продуктивности молока от хозяйства к хозяйству происходит в основном постепенно, плавно, без больших скачков, но у последнего хозяйства удой от 1 коровы существенно отличается от остальной массы хозяйств. Но это хозяйство нельзя выделить в отдельную группу, а так же поскольку между остальными хозяйствами различия небольшие, без скачков и нет других данных, указывающих границы перехода от 1 группы к другой, то выделить типичные группы на снование анализа ранжированного ряда в данном случае нельзя. Поэтому далее необходимо построить интервальный ряд распределения хозяйств.

Интервальный вариационный ряд дает возможность получить представление о количестве и характере групп. В начале решим вопрос о числе групп, на которые следует распределить совокупность хозяйств. Приближенное число n можно определить по формуле (2.1):

n = 1+3.322LgN, (2.1)

где n - число групп, N - совокупность единиц.

Эта зависимость может служить ориентированной при определении числа групп в этом случае, если распределение единиц совокупности по данному признаку приближаются к нормальному и применяются равные интервалы в группах.

n = 1+3.322Lg25 = 1+3.322*1.5 ~ 6 групп.

i = (X max - X min) / n , где (2.2)

X max - максимальное значение признака в изучаемом ранжированном ряду,

X min - минимальное значение признака в изучаемом ранжированном ряду,

n - число групп.

I = (6270 - 1364)/6 = 818

Теперь построим ряд распределения хозяйств при этой величине интервала, значение X min = 818 кг, тогда верхняя граница первой группы составит: Xmin+i = 2182 кг. Эта граница одновременно является границей второй группы. Границы остальных групп определяются аналогично. Полученные данные Представлены в таблице 2.2.

Таблица 2.2

Интервальный ряд распределения совхозов (таблица 2.2.) показывает, что в совокупности преобладают хозяйства с удоем от одной коровы (11 хозяйств) от 1364 до 2182 кг. Группы хозяйств с высокой продуктивностью малочисленны, поэтому следует их объединить, то есть провести вторичную группировку, так как в четвертой группе нет ни одного хозяйства, а в пятой одно, но в каждой группе должно быть не менее трех хозяйств.


Интервальный ряд распределения хозяйств по уровню молочной продуктивности коров.

Таблица 2.3

Вторичная группировка хозяйств по уровню молочной продуктивности коров.

Сравнение в пределах каждой группы числа хозяйств можно сказать, что число хозяйств с низким уровнем продуктивности больше, чем с высоким в значительной мере.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

хорошую работу на сайт">

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http :// www . allbest . ru /

Задание №1

На основании данных статистического наблюдения, приведенных в таблице построить ранжированный, интервальный и кумулятивный ряды распределения сельскохозяйственных предприятий по факторному признаку, изобразить их графически.

Провести сводку данных. Посредством метода группировок определите зависимость результативного признака в сельскохозяйственных предприятиях от факторного. Построить таблицы и графики зависимости. Вывод.

группировка ряд распределение факторный

Качество почвы,баллы (х)

(у)

Решение:

Построение ранжированного ряда распределения предполагает расположение всех вариантов ряда в порядке возрастания изучаемого признака (качества почвы). Проведение сортировки производилось в программе ТП Excel с использованием функции "Сортировка".

Качество почвы

Урожайность овощей открытого грунта

Графическое изображение ранжированного ряда распределения

Линия на рис.1 носит название огива Гальтона. Данная огива имеет тенденцию плавного роста с небольшими скачками в некоторых точках. Для преобразования ранжированного ряда в интервальный лучше выполнить разбивку на группы вручную.

Построение интервального ряда распределения предприятий по изучаемому признаку предполагает определение числа групп (интервалов).

Для расчета числа групп воспользуемся формулой:

n=2 , где N-общее число единиц изучаемой совокупности.

n=2 Ig30 = 2,95424251?3.

Величина равного интервала вычисляется по формуле:

i = = = 16,33333

Кумулятивный ряд - это ряд в котором подсчитываются накопленные частоты. Он показывает, сколько единиц совокупности имеют значение признака не больше, чем данное значение, и вычисляется путем последовательного прибавления к частоте первого интервала частот последующих интервалов.

Интервальный и кумулятивный ряды

частота - число предприятий в группе;

Удельный вес предприятий в группе - находится по формуле:

(число предприятий в группе*100%)/ m , где m-число экспериментальных данных;

Накопленная частота - находится по формуле: число предприятий в предедущей группе +частота данной группы.

Гистограмма частот

Кумулята распределения качества почвы

Сводные показатели

№ группы

Число предприятий в группе

Урожайность овощей открытого грунта (всего по группам)

Качество почвы (всего по группам)

II 61,33333-77,33333

III 77,33333-94,1

Средние характеристики групп

№ Группы

Урожайность овощей открытого грунта

Качество почвы

II 61,33333-77,33333

III 77,33333-94,1

В среднем по совокупности

где, столбец "урожайность овощей" находится по формуле: У У i группе ) / число предприятий в группе ;

столбец "Качество почвы" находится по формуле: У Х i группе)/число предприятий в группе.

Зависимость урожайности овощей открытого грунта от качества почвы.

В рассматриваемом примере можно сделать вывод: с ростом качества почвы увеличивается урожайность овощей открытого грунта, следовательно можно предположить наличие прямой связи между рассматриваемыми параметрами.

Размещено на Allbest.ru

Подобные документы

    Аналитическая группировка по факторному признаку. Построение вариационного частотного и кумулятивного рядов распределения на основе равно интервальной структурной группировки результативного признака – дивидендов, начисленных по результатам деятельности.

    контрольная работа , добавлен 07.05.2009

    Основные показатели численности населения и его размещения по Калужской области. Построение ранжированного и интервального рядов распределения по одному группировочному факторному признаку. Анализ типических групп по показателям в среднем по совокупности.

    курсовая работа , добавлен 11.10.2010

    Построение с помощью формулы Стержесса. Построение рядов распределения с произвольными интервалами. Построение рядов распределения с помощью среднего квадратического отклонения. Классификация рядов распределения. Расчет основных характеристик вариации.

    курсовая работа , добавлен 22.11.2013

    Анализ, расчет и построение исходных динамических рядов признака-функции и признака-фактора. Расчет показателей вариации динамических рядов. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции.

    курсовая работа , добавлен 24.09.2014

    Оценка совокупности на предмет её однородности. Построение ранжированного и интервального рядов распределения. Анализ рядов динамики методами укрупнения интервалов и скользящей средней, аналитическое выравнивание по уравнению прямой и параболы.

    курсовая работа , добавлен 10.09.2014

    Расчет среднего балла успеваемости по данным результатов сессии, определение показателя вариаций уровня знаний и структуры численности студентов по успеваемости. Построение интервального ряда распределения предприятий. Оценка коэффициентов корреляции.

    контрольная работа , добавлен 21.08.2009

    Понятие и виды статистической группировки, производимой с целью установления статистических связей и закономерностей, выявления структуры изучаемой совокупности. Построение интервального ряда распределения предприятий по признаку "торговая площадь".

    дипломная работа , добавлен 14.02.2016

    Основные категории статистики. Группировка - основа научной обработки данных статистики. Содержание сводки и статистическая совокупность. Построение вариационного, ранжированного и дискретного рядов распределения. Группировка предприятий по числу рабочих.

    контрольная работа , добавлен 17.03.2015

    Проведение расчета абсолютных, относительных, средних величин, коэффициентов регрессии и эластичности, показателей вариации, дисперсии, построение и анализ рядов распределения. Характеристика аналитического выравнивания цепных и базисных рядов динамики.

    курсовая работа , добавлен 20.05.2010

    Проведение экспериментального статистического исследования социально-экономических явлений и процессов Смоленской области на основе заданных показателей. Построение статистических графиков, рядов распределения, вариационных рядов, их обобщение и оценка.

Выбор редакции
Денежная единица РФ "...Статья 27. Официальной денежной единицей (валютой) Российской Федерации является рубль. Один рубль состоит из 100...

Техника "100 желаний" Научиться исполнять желания может каждый. Для этого нужно всего лишь договориться со своим подсознанием! А как это...

Получив атеистическое воспитание, я долгое время не испытывал интереса, а уж тем более священного трепета от религиозных святынь да...

Скакать во сне на белой лошади - прекрасный знак. В первую очередь он сулит Вам прочность дружеских связей и радость встреч с товарищами...
Заранее говорю, никогда не пробовала делать с другим сыром, только с твердыми сортами. В данном рецепте я использовала остатки трех...
Будьте чуткими к изменениям настроения любимых людей! Помните: мы получаем от мира ровно то, что ему даем. Хотите, чтобы окружающие...
Татуировка - практически такое же древнее явление, как и существование человечества. Тату были обнаружены даже на телах мумий, найденных...
Святой Спиридон Тримифунтский - очень почитаемый подвижник во всем христианском мире. К его мощам, на острове Корфу в Греции, постоянно...
Праздники, кто же их не любит? А что же легло в основу праздника День Народного Единства в России ? Праздник единства подчеркивает: какой...