Методика расчета средней арифметической величины по способу моментов. Свойства средней арифметической

Свойства средней арифметической. Расчет средней арифметической способом «моментов»

Для снижения трудоемкости расчетов используются основные свойства ср.арифм-кой:

  • 1. Если все варианты усредняемого признака увеличить/уменьшить на постоянную величину А, то средняя арифметическая соответственно увеличится/уменьшится.
  • 2. Если все варианты, определяемого признака увеличить/уменьшить в н-раз, то ср.арифм увеличится/уменьшится в н-раз.
  • 3. Если все частоты усредняемого признака увеличить/уменьшить в постоянное число раз, то ср.арифм.останется неизменной.
  • 18. Средняя гармоническая простая и взвешенная

Средняя гармоническая - используется, когда статистическая информация не содержит данных о весах по отдельным вариантам совокупности, но известны произведения значений варьирующего признака на соответствующие им веса.

Общая формула средней гармонической взвешенной имеет следующий вид:

х - величина варьирующего признака,

w - произведение значения варьирующего признака на его веса (xf)

Например, три партии товара А куплены по разным ценам (20, 25 и 40 руб.) Общая стоимость первой партии составила 2000 руб., второй партии - 5000 руб., и третьей партии - 6000 руб. Требуется определить среднюю цену единицы товара А.

Средняя цена определяется как частное от деления общей стоимости на общее количество закупленного товара. Используя среднюю гармоническую, мы получим искомый результат:


В том случае, если общие объемы явлений, т.е. произведения значений признаков на их веса равны, то применяется средняя гармоническая простая:

х - отдельные значения признака (варианты),

n - общее число вариант.

Пример. Две машины прошли один и тот же путь: одна со скоростью 60 км/час, а вторая - 80 км/час. Принимаем протяженность пути, который прошла каждая машина, за единицу. Тогда средняя скорость составит:

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Среднюю гармоническую применяют для расчетов тогда, когда в качестве весов используются не единицы совокупности - носители признака, а произведения этих единиц на значения признака (т.е. m = Xf). К средней гармонической простой следует прибегать в случаях определения, например, средних затрат труда, времени, материалов на единицу продукции, на одну деталь по двум (трем, четырем и т.д.) предприятиям, рабочим, занятым изготовлением одного и того же вида продукции, одной и той же детали, изделия.

«Способ моментов» применяется в рядах с равными интервалами на основе свойств средней арифметической. Средняя арифметическая исчисляется по формуле

где i – размер интервала;

m 1 – момент первого порядка (средняя арифметическая из новых упрощенных вариант
;
– новые упрощенные варианты;f – частота);

А – постоянное число (лучше всего взять его равным варианте, у которой наибольшая частота).

Определим среднее значение признака «способом моментов» на следующем примере.

Пример 5 . Имеются следующие данные о распределении магазинов облпотребсоюза по торговой площади (табл. 14).

Таблица 14

Следует определить среднюю площадь магазинов, применив «способ моментов».

Решение

Данные распределения магазинов по торговой площади представлены в виде интервального ряда распределения с равными интервалами (i = 20 м 2), следовательно, расчет средней площади магазина можно провести по формуле
, применив «способ моментов».

Первый и последний интервалы даны открытыми, т. е. не имеют границ нижней и верхней соответственно. Для определения среднего значения в них границы интервалов следует закрыть. Для первой группы с размером площади до 40 м 2 условно считаем, что интервал также равен 20 м 2 , затем вычитаем 20 м 2 из 40 м 2 и находим условную нижнюю границу первого интервала (20 – 40). Условную верхнюю границу последнего интервала определяем аналогично (100 – 120).

Расчеты следует проводить в табл. 15.

Таблица 15

Группировка мага- зинов по торговой площади, м 2 (х )

Удельный вес магазинов, % (f )

Середина интервала (х )

х А

Наибольшая частота f равна 40, следовательно, в качестве постоянной величины А принимаем 70.

Определяем момент первого порядка:
.

Среднее значение признака равно:

+ 70 = = 68 м 2 .

Следовательно, средняя площадь магазина составляет 68 м 2 .

5.3. Структурные средние

В качестве структурных средних чаще всего используют показатели моды и медианы. Мода (Мо ) – наиболее часто повторяющееся значение признака. Медиана (Ме ) – величина признака, которая делит упорядоченный ряд на две равные по численности части.

Если расчет моды и медианы проводится в дискретном ряду, то он опирается на их понятия. В интервальном ряду распределения для расчета моды и медианы применяют следующие формулы.

Мода рассчитывается по формуле

где х Мо – нижнее значение модального интервала;

i Мо – размер модального интервала;

f Мо – частота модального интервала;

f Мо –1 – частота, предшествующая модальной частоте;

f Мо +1 – частота, последующая за модальной частотой.

Модальному интервалу соответствует наибольшая (модальная) частота. Медиана рассчитывается по формуле

,

где х Ме – нижнее значение медианного интервала;

i Ме – размер медианного интервала;

f – сумма частот;

S Ме –1 – сумма частот, предшествующих медианной частоте;

f Ме – медианная частота.

Медианному интервалу соответствует медианная частота. Таким интервалом будет интервал, сумма накопленных частот которого равна или превышает половину суммы всех частот.

Рассмотрим определение моды и медианы на следующих примерах.

Пример 6 . В результате статистического обследования области получены следующие данные по распределению семей по числу детей (табл. 16).

Таблица 16

Следует определить моду и медиану.

Решение

В дискретных рядах модой является варианта с наибольшей частотой. Наибольшая частота – 34, следовательно мода равна 2.

Для вычисления медианы определим сумму частот ряда (f = 100), затем рассчитаем полусумму
.

Так как сумма накопленных частот 5 + 32 + 34 = 71 превышает полусумму (71 > 50), то варианта, имеющая значение 2 и соответствующая этой накопленной сумме частот, и есть медиана.

Пример 7 . В результате статистического обследования получены следующие данные распределения продавцов магазинов облпотребсоюза по возрасту (табл. 17).

Таблица 17

Необходимо определить моду и медиану.

Решение

В интервальных рядах мода и медиана определяются по вышеприведенным формулам.

Сначала определим модальный интервал, он соответствует наибольшей частоте. Так как наибольшая частота равна 35 и является модальной, то интервал 30–40 является модальным интервалом. Затем подставим данные в следующую формулу:

Определим медианный интервал. Полусумма частот равна 50
. Накапливая частоты, определим интересующий интервал. Так как сумма накопленных частот 6 + 24 + 35 = 65 превышает полусумму (65 > 50), значит 35 является медианной частотой, а интервал 30–40 является медианным интервалом.

Затем подставим данные в формулу

Таким образом, мода равна 35,5 лет (больше всего продавцов в возрасте 35,5 лет), медиана – 35,7 лет (50 % продавцов достигли возраста 35,7 лет).

М ср - рассчитанная при помощи метода моментов = 61,6 кг

Средняя арифметическая величина обладает тремя свой­ствами.

1. Средняя занимает серединное положение в вариационном ряду . В строго симметричном ряду: М = М 0 =М е.

2. Средняя является обобщающей величиной и за средней не видны случайные колебания, различия в индивидуальных данных, она вскрывает то типичное, что характерно для всей совокуп­ности . К средней обращаются всякий раз, когда надо исклю­чить случайное влияние от­дельных факторов, выявить об­щие черты, существующие за­кономерности, получить полное и глубокое представление о наиболее общих и характерных особенностях всей группы.

3. Сумма отклоне­ний всех вариант от средней равна нулю : S (V-M)= 0 . Это происходит потому, что средняя величина превышает размеры одних вариант и мень­ше размеров других вариант.

Иначе говоря, истинное отклонение вариант от истинной средней (d =v-М) может быть положительной и отрицательной величи­ной, поэтому сумма S всех "+"d и "-"d равна нулю.

Данное свойство средней используется при проверке правильности расчетов М. Если сумма отклонений вариант от средней равна нулю, то можно сделать вывод, что средняя вычислена правильно. На этом свойстве основан способ моментов для определения М. Ведь если условная средняя А будет равна истинной М, то сумма отклонений вариант от условной средней будет равна нулю.

Роль средних величин в биологии чрезвычайно велика. С одной стороны их используют для характеристики явлений в целом, с другой - они необходимы для оценки отдельных величин. При сравнении отдельных величин со средними получают ценные харак­теристики для каждой из них. Использование средних величин требует строгого соблюдения принципа однородности совокупности. Нарушение этого принципа искажает представление о реальных процессах.

Вычисление средних из неоднородной в социально-экономическом отношении совокупности делает их фик­тивными, искаженными. Следовательно, для того чтобы правильно использовать средние величины, надо быть уверенным в том, что они характеризуют однородные статистические совокупности.

ХАРАКТЕРИСТИКА РАЗНООБРАЗИЯ ПРИЗНАКА В

СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ

Величина того или иного признака неодинакова у всех членов совокупности, несмотря на ее относительную однородность. Напри­мер, в группе детей, однородной по возрасту, полу и месту житель­ства, рост каждого ребенка отличается от роста сверстников. То же можно сказать о числе посещений, сделанных отдельными лицами в поликлинику, об уровне белка крови у каждого больного ревматизмом, об уровне артериального давления у отдельных лиц, больных гипертонической болезнью и т. п. В этом проявляется разнообразие, колеблемость признака в изучаемой совокупности. Вариабельность демонстративно можно представить на примере роста в группах подростков.



Статистика позволяет охарактеризовать это специальными крите­риями, определяющими уровень разнообразия каждого признака в той или иной группе. К таким критериям относятся лимит (lim), амплитуда ряда (Am), среднее квадратическое отклонение (s) и коффициент вариации (C v). Так как каждый из этих крите­риев имеет свое самостоятельное значение, то следует остановиться на них отдельно.

Лимит - опреде­ляется крайними значе­ниями вариант в вариа­ционном ряду

Амплитуда (Am) - разность край­них вариант

Лимит и амплитуда - дают определен­ную информацию о степени разнообразия роста в каждой группе. Однако как лимит, так и амплитуда ряда обладает одним существенным недостатком. Они учитывают только разно­образие крайних вариант и не позволяют получить информацию о разнообразии признака в совокупности с учетом ее внутренней структуры. Дело в том, что разнообразие проявляется не столько в крайних вариантах, сколько при анализе всей внутренней структуры группы. Поэтому этими критериями можно пользоваться для при­ближенной характеристики разнообразия, особенно при малом чис­ле наблюдений (n<30).

Наиболее полную характеристику разноо­бразию признака в совокупности дает так называемое среднее квадратическое отклоне­ние , обозначаемое греческой буквой "сигма" - s.

Существует два способа расчета среднего квадратического отклонения : среднеарифметический и способ моментов .

При сред­неарифметическом способе расчета применяют формулу, где d - истинное отклонение вариант от истинной средней (V-M).

Формула используется при небольшом числе наблюдений (n<30), когда в вариационном ряду все частоты р= 1.

При р > 1 используют формулу такого вида:

При наличии вычислительной техники эту формулу приме­няют и при большом количестве наблюдений.

Эта формула предназначена для определения "сигмы" по способу моментов:


где: a - условное отклонение от условной средней (V-A ); p - частота встречаемости для варианты; n - число вариант; i - величина интервала между группами.

Этот способ применяется в тех случаях, когда нет вычислитель­ной техники, а вариационный ряд громоздкий как за счет большого числа наблюдений, так и за счет вариант, выраженных многознач­ными числами. При числе наблюдений, равном 30 и менее, в момен­те второй степени п заменяют за (п -1).

Как видно из формулы среднего квадратичного отклонения (4), в знаменателе стоит (п -1), т.е. при числе наблюдений, равном или меньшем 30 (n£30), необходимо в знаменатель формулы брать (п -1). Если при определении средней арифметической М учиты­вают все элементы ряда, то, рассчитывая а, надо брать не все случаи, а на единицу меньше (п-1).

При большом числе наблюдений (n>30) в знаменатель формулы берут п, так как единица не изменяет результаты расчета и поэтому автоматически опускается.

Следует обратить внимание на то, что среднее квадратическое отклонение - именованная величина , поэтому оно должно иметь обозначение, общее для вариант и средней арифметической вели­чины (размерность – кг, см. км и др).

Расчет среднего квадратического отклонения по способу момен­тов производится после расчета средней величины.

Существует еще один критерий, характеризующий уровень раз­нообразия величин признака в совокупности, - коэффициент ва­риации .

Коэффициент вариации (Сv) - является относительной мерой разнообразия, так как исчисляется как процентное отноше­ние среднего квадратического отклонения (а) к средней арифме­тической величине (М). Формула коэффициента вариации такова:

Для ориентировочной оценки степени разнообразия признака пользуются следующими градациями коэффициента вариации. Если коэффициент составляет более 20%, то отмечают сильное разно­образие; при 20-10% - среднее, и если коэффициент менее 10%, то считают, что разнообразие слабое.

Коэффициент вариации применяют при сравнении степени раз­нообразия признаков, имеющих различия в величине признаков или неодинаковую их размерность. Допустим, необходимо сравнить степень разнообразия массы тела у новорожденных и 5-летних детей. Понятно, что у новорожденных "сигма" всегда будет меньше, чем у семилетних детей, так как меньше их индивидуальная масса. Среднее квадратическое отклонение будет меньше там, где меньше величина самого признака. В этом случае для определения различия в степени разнообразия необходимо ориентироваться не на среднее квадратическое отклонение, а на относительную меру разнообразия - коэффициент вариации Сv.

Большое значение коэффициент вариации также имеет для оцен­ки и сопоставления степени разнообразия нескольких признаков с разной размерностью. По среднему квадратическому отклонению нельзя еще судить о различии в сте­пени разнообразия указанных признаков. Для этого необходимо использовать коэффициент вариации – Сv.

Среднее квадратическое отклонение связано со структурой ряда распределения признака. Схематич­но это можно изобразить следующим образом.

Теорией статистики доказано, что при нормальном распределе­нии в пределах М±s находится 68% всех случаев, в пределах М±2s - 95,5% всех случаев, а в пределах М±3s - 99,7% всех случаев, составляющих совокупность. Таким образом, М±3s охва­тывает почти весь вариационный ряд.

Это теоретическое положение статистики о закономерностях структуры ряда имеет огромное значение для практического при­менения среднего квадратического отклонения. Можно восполь­зоваться этим правилом для выяснения - вопроса о типичности средней величины. Если 95% всех вариант находятся в пределах М±2s, то средняя - является характерной для данного ряда и не требуется увеличивать число наблюдений в совокупности. Для опре­деления типичности средней сравнивается фактическое распреде­ление с теоретическим, путем расчета сигмальных отклонений.

Практическое значение среднего квадратического отклонения заключается также в том, что зная М и s , можно построить необходимые вариационные ряды для практического использования. Сигму (s ) также используют для сравнения степени разнообразия однород­ных признаков, например при сравнении колебаний (вариабель­ности) роста детей в городе и селе местности. Зная сигму (s ), можно рассчитать коэффициент вариации (Сv), необходимой для сравнения степени разнообразия признаков, выраженных в различных единицах измерения (сантиметрах, килограммах и др.). Это позволяет выявить более устойчивые (постоянные) и менее устойчивые признаки в совокупности.

Сравнивая коэффициенты вариации (C v), можно сделать выводы о том, что является наиболее устойчивым признаком в совокупности признаков. Среднее квадратическое отклонение (s) используется также для оценки отдельных признаков у одного объекта. Стандартное отклонение указывает, на сколько сигм (s ) от средней (М) отклоняются индивидуальные измерения.

Среднее квадратическое отклонение (s) может быть исполь­зовано в биологии и экологии при разработке проблем нормы и патологии.

Наконец, среднее квадратическое отклонение является важным компонентом формулы т м - сред­ней ошибки средней арифметической (ошибки ре­презентативности):

где т м - средняя ошибка средней арифметической величины (ошибка репрезентативности), п - число наблюдений.

Репрезентативность. Важнейшие теоретические основы репрезентативности были освещены выше в разделе, посвященном выборочной и генеральной совокупности. Репрезентативность означает представительность в выборочной совокупности всех учитываемых признаков (пол, возраст, профессия, стаж и др.) единиц наблюдения, составляющих генеральную совокупность. Достигается эта репрезентативность выборочной совокупности по отношению к генеральной с помощью специальных методов отбора, которые излагаются ниже.

Оценка достоверности результатов исследования базируется на теоретических основах репрезентативности.

ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ

Под достоверностью статистических показа­телей следует понимать степень их соответствия отображаемой ими действительности. Достоверными результатами считаются те, которые не искажают и правильно отражают объективную реальность.

Оценить достоверность результатов исследования означает определить, с какой вероятностью возможно перенести результаты, полученные на выборочной совокупности, на всю генеральную совокупность.

В большинстве исследований исследователю приходится, как правило, иметь дело с частью изучаемого явления, а выводы по результатам такого исследования переносить на все явление в целом - на генеральную совокупность.

Таким образом, оценка достоверности необходима для того, чтобы по части явления должно было бы судить о явлении в целом, о его закономерностях.

Оценка достоверности результатов исследования предусматривает определение:

1) ошибок репрезентативности (средних ошибок средних арифметических и относительных величин) - т ;

2) доверительных границ средних (или относительных) величин;

3) достоверности разности средних (или относительных) величин
(по критерию
t );

4) достоверности различия сравниваемых групп по критерию c 2 .

1. Определение средней ошибки средней (или относительной) величины (ошибки репре­зентативности) - т.

Ошибка репрезентативности (m ) является важнейшей стати­стической величиной, необходимой для оценки достоверности ре­зультатов исследования. Эта ошибка возникает в тех случаях, когда требуется по части охарактеризовать явление в целом. Эти ошибки неизбежны. Они проистекают из сущности выбороч­ного исследования; генеральная совокупность может быть охарак­теризована по выборочной совокупности только с некоторой по­грешностью, измеряемой ошибкой репрезентативности.

Ошибки репрезентативности нельзя смешивать с обычным пред­ставлением об ошибках: методических, точности измерения, ариф­метических и др.

По величине ошибки репрезентативности определяют, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, которые могли бы быть получены при проведении сплошного исследования всех без исключения элементов генераль­ной совокупности.

Этот единственный вид ошибок, учитываемых статистическими методами, которые не могут быть устранены, если не осуществлен переход на сплошное изучение. Ошибки репрезентативности можно свести к достаточно малой величине, т. е. к величине допустимой погрешности. Делается это путем привлечения в выборку достаточ­ного количества наблюдений (п).

Каждая средняя величина - М (средняя длительность лечения, средний рост, средняя масса тела, средний уровень белка крови и др.), а также каждая относительная величина - Р (уровень ле­тальности, заболеваемости и др.) должны быть представлены со своей средней ошибкой - т. Так, средняя арифметическая вели­чина выборочной совокупности (М) имеет ошибку репрезентатив­ности, которая называется средней ошибкой средней арифметической (m м) и определяется по формуле:

Как видно из этой формулы, величина средней ошибки средней арифметической прямо пропорциональна степени разнообразия признака и обратно пропорциональна корню квадратному из числа наблюдений. Следовательно, уменьшение величины этой ошибки при определении степени разнообразия (s ) возможно путем увели­чения числа наблюдений.

На этом принципе основан метод определения достаточного числа наблюдений для выборочного исследования.

Относительные величины (Р), полученные при выборочном исследовании, также имеют свою ошибку репрезентативности, которая называется средней ошибкой относительной величины и обозначается m р

Для определения средней ошибки относительной величины (Р) используется следующая формула:

где Р - относительная величина. Если показатель выражен в про­центах, то q=100-P, если Р- в промиллях, то q=1000-P, если Р- в продецимиллях, то q= 10000-Р и т.д.; п - число наблю­дений. При числе наблюдений менее 30 в знаменатель следует взять (п – 1 ).

Каждая средняя арифметическая или относительная величина, полученная на выборочной совокупности, должна быть представ­лена со своей средней ошибкой. Это дает возможность" рассчи­тать доверительные границы средних и относительных величин, а также определить достоверность разности сравниваемых пока­зателей (результатов исследования).

Методы вычисления средней арифметической (средней арифметической простой и взвешенной, по способу моментов)

Определяем средние величины:

Мода (Мо) =11, т.к. данная варианта встречается в вариационном ряду наиболее часто (р=6).

Медиана (Ме) - порядковый номер варианты занимающей срединное положение = 23, это место в вариационном ряду занимает варианта равная 11. Средняя арифметическая (М) позволяет наиболее полно охарактеризовать средний уровень изучаемого признака. Для вычисления средней арифметической используется два способа: среднеарифметический способ и способ моментов.

Если частота встречаемости каждой варианты в вариационном ряду равна 1, то рассчитывают среднюю арифметическую простую, используя среднеарифметический способ: М = .

Если частота встречаемости вариант в вариационном ряду отличается от 1, то рассчитывают среднюю арифметическую взвешенную, по среднеарифметическому способу:

По способу моментов: А - условная средняя,

М = A + =11 += 10.4 d=V-A, A=Mo=11

Если число вариант в вариационном ряду более 30, то строится сгруппированный ряд. Построение сгруппированного ряда:

1) определение Vmin и Vmax Vmin=3, Vmax=20;

2) определение количества групп (по таблице);

3) расчет интервала между группами i = 3;

4) определение начала и конца групп;

5) определение частоты вариант каждой группы (таблица 2).

Таблица 2

Методика построения сгруппированного ряда

Длительность

лечения в днях

n=45 p=480 p=30 2 p=766

Преимущество сгруппированного вариационного ряда заключается в том, что исследователь работает не с каждой вариантой, а только с вариантами, являющимися средними для каждой группы. Это позволяет в значительной степени облегчить расчеты средней.

Величина того или иного признака неодинакова у всех членов совокупности, несмотря на ее относительную однородность. Данную особенность статистической совокупности характеризует одно из групповых свойств генеральной совокупности - разнообразие признака . Например, возьмем группу мальчиков 12 лет и измерим их рост. После проведенных расчетов средний уровень данного признака составит 153 см. Но средняя характеризует общую меру изучаемого признака. Среди мальчиков данного возраста есть мальчики, рост которых составляет 165 см или 141 см. Чем больше мальчиков будут иметь рост отличный от 153 см, тем больше будет разнообразие этого признака в статистической совокупности.

Статистика позволяет охарактеризовать данное свойство следующим критериями:

лимит (lim),

амплитуда (Amp),

среднеквадратическое отклонение (у),

коэффициент вариации (Сv).

Лимит (lim) определяется крайними значениями вариант в вариационном ряду:

lim=V min /V max

Амплитуда (Amp) - разность крайних вариант:

Amp=V max -V min

Данные величины учитывают только разнообразие крайних вариант и не позволяют получить информацию о разнообразии признака в совокупности с учетом ее внутренней структуры. Поэтому данными критериями можно пользоваться для приближенной характеристики разнообразия, особенно при малом числе наблюдений (n<30).

вариационный ряд медицинская статистика

Поделиться: