Главная » Правовые вопросы » Смотреть страницы где упоминается термин систематическая ошибка. Влияние и значение систематических ошибок

Смотреть страницы где упоминается термин систематическая ошибка. Влияние и значение систематических ошибок

Выборочное обследование

Создать выборку означает выбрать, кого опрашивать. Часто бывает невозможно и не нужно опрашивать всех членов целевого рынка, чтобы узнать мнение о том или ином вопросе, но важно опросить достаточное число людей нужного типа, чтобы полученные данные были вполне репрезентативными для рынка в целом.

Нахождение правильного состава респондентов имеет важное значение, поскольку исследователь пытается сделать выводы о целевом рынке в целом; во многих случаях при проведении обследования опрашивают мнение не более 100 респондентов, чтобы сделать выводы о потребителях, исчисляющихся миллионами. Это означает, что, когда наступит время анализа, небольшая ошибка в отборе выборки будет умножена многократно.

Рамочная выборка - это список респондентов, из которых исследователь хочет получить выборку. В некоторых случаях бывает, что такой список можно достать: например, если исследователь хочет выборочно обследовать мнение врачей, то он может получить список фамилий и адресов всех врачей страны. После этого будет относительно не сложно составить выборку из этого списка. Более вероятно, однако, что нужного исследователю списка взять негде, например списка людей, игравших в сквош (род упрощенного тенниса) за последние три месяца, которого, скорее всего, не существует. В таких случаях исследователю нужно составить репрезентативную выборку людей с требуемыми характеристиками. Это задание нередко бывает сложным .

В табл. 5.3 представлены некоторые методы создания выборки.

В последнее время наметился переход от использования вероятностных выборок к выборкам пропорциональным, при этом при создании выборок все шире применяются базы данных . Это вызвано тем, что пропорциональную выборку получить легче, полученные с ее помощью данные более надежны, а существование баз данных позволяет легко создавать выборки для почтовых опросов.

Таблица 5.8, Методы создания выборки

Метод	Описание	Преимущества	Недостатки
Случайная, или вероятностная, выборка	Каждый человек, входящий в население в целом, имеет одинаковые шансы быть включенным в выборку	Дает поперечный срез мнений населения	Почти невозможно достичь. Большинство так называемых "случайных" выборок имеют серьезные отклонения: например, выбор имен из телефонной книги может казаться случайным, но по сути в такую выборку будут включены только люди, имеющие телефон, и в нее не будут включены даже люди, просто не попавшие в справочник
Пропорциональная выборка	Сначала проводится анализ населения, часто с использованием данных переписи. Затем устанавливается квота для каждой категории (например, женщины в возрасте 35 лет, 20-летние мужчины, профессионалы среднего возраста), и интервьюерам велят придерживаться квот	Обеспечивает четкий поперечный срез мнений при условии правильного установления квот	Часто означает, что интервьюеры отметают респондентов из-за того, что они не подходят под квоты, и к концу дня интервьюеры нередко тратят много времени в поисках этого последнего "35-летнего работника физического труда с двумя детьми"
Стратифицированная выборка	Аналогична пропорциональной выборке в том смысле, что определяются широкие слои населения, но окончательный выбор респондента производится практически случайно	Менее расточительное отношение к респондентам, чем в случае пропорциональной выборки, больше гибкости для интервьюеров, а значит, такое обследование обходится дешевле	Точность ниже, чем в случае пропорциональной выборки

Техника интервью

При проведении опроса интервьюеру слишком просто "подвести" респондентов к "правильному" высказыванию. Иногда этому способствуют респонденты, сами задавая вопросы; хорошие интервьюеры избегают искушения вмешаться и помочь в этот момент.

Избежать этого можно, сказав, например: "Нам важно узнать именно ваше мнение. Что думаете вы?" или просто посмотрев вопросительно. Можно также порекомендовать заранее объяснить респондентам, что вы не сможете помочь им с ответами.

В случае использования фокус-групп или групповых глубинных интервью возникает проблема, связанная с необходимостью решить, следует ли продолжать ту или иную линию разговора или же оборвать ее. То, что на первый взгляд может показаться абсолютно не относящимся к делу отступлением от темы, может в конечном счете изменить направление дискуссии и позволить сделать какие-либо очень важные выводы; с другой стороны, если интервью превратится в общую болтовню, ничего полезного не получится. В некоторых случаях ведущий может просто спросить, как эта тема относится к предмету исследования. Иногда это позволяет получить быстрое объяснение связи или, в противном случае, быстро вернуться к теме обсуждения.

На практике группы, как правило, придерживаются обсуждаемой темы; отклонения случаются редко и длятся обычно недолго.

Источники систематических ошибок

Систематическая ошибка - это следствие воздействия, в результате которого та или иная внешняя сила делает обследование недостоверным.

Систематическая ошибка выборки

Это происходит, когда выборка является нерепрезентативной для изучаемого населения. Легко попасться в ловушку, думая, что выборка является репрезентативной, когда на самом деле она взята из маленькой популяции. Например, исследователь проводит опрос, допустим, на главной улице, останавливая каждого третьего посетителя магазинов. Это обследование не будет репрезентативным, поскольку оно включает лишь тех, кто пришел в этот день за покупками на главную улицу. Если такого рода обследование предпринято, к примеру, во вторник после полудня, в него может попасть в процентном отношении больше пенсионеров и безработных, чем присутствует во всем населении. Если аналогичное исследование будет проведено в субботу пополудни, то, скорее всего, в него не попадут спортивные болельщики.

Систематическая ошибка интервьюера

Это происходит, когда интервьюер хочет помочь респонденту ответить на вопрос. Интервьюеры, естественно, хотят пройти все вопросы анкеты с минимальными проблемами, к тому же они осознают, что у респондента есть чем заняться кроме того, чтобы отвечать на затруднительные или плохо сформулированные вопросы. Если интервьюер замечает, что респонденты проявляют отрицательную реакцию на некоторые вопросы, он может в будущем пропускать их и "угадывать" ответы. К сожалению, известно, что некоторые недобросовестные интервьюеры подделывают все ответы, если у них возникают трудности с нахождением достаточного количества респондентов для квоты .

Систематическая ошибка интервьюера может быть едва заметной; в не ограниченных временем интервью лицом к лицу "язык тела" интервьюера (выражение лица, жесты и пр.) может передать респонденту сигнал, который приведет к тому, что будет дан некий специфический ответ, или к тому, что часть информации не будет предоставлена.

Систематической погрешностью называется составляющая погрешности измерения, остающаяся постоянной или закономерно меняющаяся при повторных измерениях одной и той же величины. При этом предполагается, что систематические погрешности представляют собой определенную функцию неслучайных факторов, состав которых зависит от физических, конструкционных и технологических особенностей средств измерений, условий их применения, а также индивидуальных качеств наблюдателя. Сложные детерминированные закономерности, которым подчиняются систематические погрешности, определяются либо при создании средств измерений и комплектации измерительной аппаратуры, либо непосредственно при подготовке измерительного эксперимента и в процессе его проведения. Совершенствование методов измерения, использование высококачественных материалом, прогрессивная технология - все это позволяет на практике устранить систематические погрешности настолько, что при обработке результатов наблюдений с их наличием зачастую не приходится считаться.

Систематические погрешности принято классифицировать в зависимости от причин их возникновения и по характеру их проявления при измерениях.

В зависимости от причин возникновения рассматриваются четыре вида систематических погрешностей.

1. Погрешности метода, или теоретические погрешности, проистекающие от ошибочности или недостаточной разработки принятой теории метода измерений в целом или от допущенных упрощений при проведении измерений.

Погрешности метода возникают также при экстраполяции свойства, измеренного на ограниченной части некоторого объекта, на весь объект, если последний не обладает однородностью измеряемого свойства. Так, считая диаметр цилиндрического вала равным результату, полученному при измерении в одном сечении и в одном направлении, мы допускаем систематическую погрешность, полностью определяемую отклонениями формы исследуемого вала. При определении плотности вещества по измерениям массы и объема некоторой пробы возникает систематическая погрешность, если проба содержала некоторое количество примесей, а результат измерения принимается за характеристику данного вещества -вообще.

К погрешностям метода следует отнести также те погрешности, которые возникают вследствие влияния измерительной аппаратуры на измеряемые свойства объекта. Подобные явления возникают, например, при измерении длин, когда измерительное усилие используемых приборов достаточно велико, при регистрации быстропротекаюших процессов недостаточно быстродействующей аппаратурой, при измерениях температур жидкостными или газовыми термометрами и т.д.

2. Инструментальные погрешности, зависящие от погрешностей применяемых средств измерений.. Среди инструментальных погрешностей в отдельную группу выделяются погрешности схемы, не связанные с неточностью изготовления средств измерения и обязанные своим происхождением самой структурной схеме средств измерений. Исследование инструментальных погрешностей является предметом специальной дисциплины - теории точности измерительных устройств.

3. Погрешности, обусловленные неправильной установкой и взаимным расположением средств измерения, являющихся частью единого комплекса, несогласованностью их характеристик, влиянием внешних температурных, гравитационных, радиационных и других полей, нестабильностью источников питания, несогласованностью входных и выходных параметров электрических цепей приборов и т.д.

4. Личные погрешности, обусловленные индивидуальными особенностями наблюдателя. Такого рода погрешности вызываются, например, запаздыванием или опережением при регистрации сигнала, неправильным отсчетом десятых долей деления шкалы, асимметрией, возникающей при установке штриха посередине между двумя рисками.

По характеру своего поведения в процессе измерения систематические погрешности подразделяются на постоянные и переменные.

Постоянные систематические погрешности возникают, например, при неправильной установке начала отсчета, неправильной градуировке и юстировке средств измерения и остаются постоянными при всех повторных наблюдениях. Поэтому, если уж они возникли, их очень трудно обнаружить в результатах наблюдений.

Среди переменных систематических погрешностей принято выделять прогрессивные и периодические.

Прогрессивная погрешность возникает, например, при взвешивании, когда одно из коромысел весов находится ближе к источнику тепла, чем другое, поэтому быстрее нагревается и

удлиняется. Это приводит к систематическому сдвигу начала отсчета и к монотонному изменению показаний весов.

Периодическая погрешность присуща измерительным приборам с круговой шкалой, если ось вращения указателя не совпадает с осью шкалы.

Все остальные виды систематических погрешностей принято называть погрешностями, изменяющимися по сложному закону.

В тех случаях, когда при создании средств измерений, необходимых для данной измерительной установки, не удается устранить влияние систематических погрешностей, приходится специально организовывать измерительный процесс и осуществлять математическую обработку результатов. Методы борьбы с систематическими погрешностями заключаются в их обнаружении и последующем исключении путем полной или частичной компенсации. Основные трудности, часто непреодолимые, состоят именно в обнаружении систематических погрешностей, поэтому иногда приходится довольствоваться приближенным их анализом.

Способы обнаружения систематических погрешностей. Результаты наблюдений, полученные при наличии систематических погрешностей, будем называть неисправленными и в отличие от исправленных снабжать штрихами их обозначения (например, Х1, Х 2 и т.д.). Вычисленные в этих условиях средние арифметические значения и отклонения от результатов наблюдений будем также называть неисправленными и ставить штрихи у символов этих величин. Таким образом,

Поскольку неисправленные результаты наблюдений включают в себя систематические погрешности, сумму которых для каждого /-го наблюдения будем обозначать через 8., то их математическое ожидание не совпадает с истинным значением измеряемой величины и отличается от него на некоторую величину 0, называемую систематической погрешностью неисправленного среднего арифметического. Действительно,

Если систематические погрешности постоянны, т.е. 0 / = 0, /=1,2, ..., п, то неисправленные отклонения могут быть непосредственно использованы для оценки рассеивания ряда наблюдений. В противном случае необходимо предварительно исправить отдельные результаты измерений, введя в них так называемые поправки, равные систематическим погрешностям по величине и обратные им по знаку:

Таким образом, для нахождения исправленного среднего арифметического и оценки его рассеивания относительно истинного значения измеряемой величины необходимо обнаружить систематические погрешности и исключить их путем введения поправок или соответствующей каждому конкретному случаю организации самого измерения. Остановимся подробнее на некоторых способах обнаружения систематических погрешностей.

Постоянные систематические погрешности не влияют на значения случайных отклонений результатов наблюдений от средних арифметических, поэтому никакая математическая обработка результатов наблюдений не может привести к их обнаружению. Анализ таких погрешностей возможен только на основании некоторых априорных знаний об этих погрешностях, получаемых, например, при поверке средств измерений. Измеряемая величина при поверке обычно воспроизводится образцовой мерой, действительное значение которой известно. Поэтому разность между средним арифметическим результатов наблюдения и значением меры с точностью, определяемой погрешностью аттестации меры и случайными погрешностями измерения, равна искомой систематической погрешности.

Одним из наиболее действенных способов обнаружения систематических погрешностей в ряде результатов наблюдений является построение графика последовательности неисправленных значений случайных отклонений результатов наблюдений от средних арифметических.

Рассматриваемый способ обнаружения постоянных систематических погрешностей можно сформулировать следующим образом: если неисправленные отклонения результатов наблюдений резко изменяются при изменении условий наблюдений, то данные результаты содержат постоянную систематическую погрешность, зависящую от условий наблюдений.

Систематические погрешности являются детерминированными величинами, поэтому в принципе всегда могут быть вычислены и исключены из результатов измерений. После исключения систематических погрешностей получаем исправленные средние арифметические и исправленные отклонения результатов наблюдении, которые позволяют оценить степень рассеивания результатов.

Для исправления результатов наблюдений их складывают с поправками, равными систематическим погрешностям по величине и обратными им по знаку. Поправку определяют экспериментально при поверке приборов или в результате специальных исследований, обыкновенно с некоторой ограниченной точностью.

Поправки могут задаваться также в виде формул, по которым они вычисляются для каждого конкретного случая. Например, при измерениях и поверках с помощью образцовых манометров следует вводить поправки к их показаниям на местное значение ускорения свободного падения

где Р - измеряемое давление.

Введением поправки устраняется влияние только одной вполне определенной систематической погрешности, поэтому в результаты измерения зачастую приходится вводить очень большое число поправок. При этом вследствие ограниченной точности определения поправок накапливаются случайные погрешности и дисперсия результата измерения увеличивается.

Систематическая погрешность, остающаяся после введения поправок на ее наиболее существенные составляющие включает в себя ряд элементарных составляющих, называемых неисключенными остатками систематической погрешности. К их числу относятся погрешности:

Определения поправок;

Зависящие от точности измерения влияющих величин, входящих в формулы для определения поправок;

Связанные с колебаниями влияющих величин (температуры окружающей среды, напряжения питания и т.д.).

Перечисленные погрешности малы, и поправки на них не вводятся.

Анализа необходимо по затраченному объему раствора H I и его концентрации вычислить из уравнения реакции соответствующее количество определяемой щелочи. Если концентрация раствора H I была в свое время определена неверно, то эта ошибка в качестве постоянной систематической ошибки отразится на всех результатах отдельных определений и, несмотря на хорошую воспроизводимость, полученные результаты будут совершенно неправильными.

По своему характеру ошибки анализа подразделяются на 1) систематические ошибки 2) случайные ошибки 3) промахи.

Систематические ошибки. Систематическими ошибками называют погрешности, одинаковые по знаку, происходящие от определенных причин, влияющих на результат либо в сторону увеличения, либо в сторону уменьшения его. Систематические ошибки можно обычно предусмотреть и устранить их или же ввести соответствующие поправки. Отметим следующие виды систематических ошибок.

Действительно, при этом условии все систематические ошибки определения будут совершенно одинаковыми в обоих случаях и на результате определения не отразятся.

Т - истинное значение II - среднее значение III - систематическая ошибка IV - область случайных колебаний.

Ошибки оперативные. Оперативные ошибки происходят от неправильного или недостаточно тщательного выполнения аналитических операций . Сюда относится, например, недостаточное промывание осадков , приводящее к постоянному завышению результатов, иногда - излишнее промывание осадков , приводящее к систематическим потерям. Систематические ошибки появляются также в результате недостаточной или чрезмерной продолжительности прокаливания осадков , недостаточно тщательного перенесения осадков из стакана в тигель, неправильного способа выливания растворов из пипеток и т. п.

Систематическая ошибка обусловлена погрешностями измерительных устройств (что становится причиной получения слишком больших или малых значений измеряемой величины) либо неправильной методикой проведения измерений (например, пренебрежением влияния температуры окружающей среды , колебания атмосферного давления и т. п.). Систематическую ошибку можно компенсировать, вводя в расчет результата измерения соответствующие поправки.

Как же надо обрабатывать результаты отдельных измерений (каждое из которых содержит случайную ошибку) для того, чтобы получить величину, более всего приближающуюся к точному значению Приступая к решению этой задачи, мы предполагаем, что систематические ошибки исключены.

Систематические ошибки зависят от используемого метода или прибора иногда их называют методическими ошибками . Они связаны как с допущениями, принятыми при разработке метода измерения, так и с возможными смещениями показаний приборов (сдвиг пулевой точки и т. п.). Отличительной чертой таких ошибок является смещение измеряемых величин в одну сторону от

Очевидно, что применение математических методов не может дать ответ на вопрос, насколько у отличается от (х, если имеют место систематические ошибки физического метода . Математическая статистика в этом случае позволит лишь оценить область вокруг у, в которой могут находиться величины у[. Величина у будет хорошей оценкой х, если возможны только случайные ошибки только при этом условии справедлива левая часть соотношения (И-2).

Случайными называются погрешности непостоянные по знаку и величине, вызываемые большим количеством случайных причин, которые приводят к рассеиванию размеров деталей относительно систематической ошибки. Появление случайных ошибок незакономерно, поэтому величину их нельзя определить заранее.

Функциональные погрешности разделяются на определенные и неопределенные. Функционально определенные - это такие ошибки, величина и закономерность изменения которых может быть определена аналитически, т. е. они являются систематическими ошибками, изменяющимися по определенному закону.

Выявляются и суммируются систематические ошибки (координаты середины полей допусков) для групп составляющих размеров, имеющих только скалярные ошибки - по формуле (39) векторные ошибки - по формуле (53) функционально связанные ошибки - по формуле (56) коррелятивно связанные ошибки- по формуле (59) силовые и температурные деформации - по формуле (60) зазоры -по формуле (70).

Пример 3. Поле рассеивания отклонений непараллельности осей шатунных и коренных шеек коленчатого вала компрессора 4АУ-15 (фиг. 16) равно по величине допуску на изготовление, т. е. выбранный круглошлифовальный станок соответствует требуемой точности, но имеется значительная погрешность базирования валов в приспособлении (систематическая ошибка).

Установлено, что нри определении концентраций веществ без систематической ошибки оценки констант , минимизирующие квадратичную форму Фз, будут несмещенными. Вычисление концентраций J производится или на основе интегральной формы кинетического уравнения , или численным интегрированием системы кинетических уравнений.

Точки плана для построения полинома степени п выбирают таким образом, чтобы получить минимальную величину систематической ошибки, связанной с тем, что функция отклика есть полином степени Лг> . Принципы, используемые при выборе подходящих планов, были предложены ранее Боксом и Дрепером .

Успех подобного подхода свидетельствует о том, что обсуждаемая поправка (на которую, вообще говоря, могут влиять и другие, не учитываемые здесь систематические ошибки) достаточно устойчива в пределах одного титрования. Такую устойчивость отмечали также Гордиенко и Сидоренко , применявшие поправки к pH при определении констант кислотно -основных равновесий.

Все приведенные планы построены в предположении, что существует только систематическое смещение. На практике обычно кроме систематической ошибки экспериментальные данные содержат также и случайную ошибку.

Основанное иа этих приемах планирование существенно снижает влияние не только случайных, но и систематических ошибок в первичных данных. Роль последних часто игнорируется без каких-либо оснований. Вместе с тем систематические ошибки могут приводить к полному обесцениванию конечны. результатов.

Систематическая ошибка при измерении pH компенсируется соответствующим изменением коэффициента активности (подбором эффективного коэффициента активности). Пусть в нашем распоряжении есть алгоритм и программа для определения нескольких неизвестных констант ЗДМ по потенциометрическим (например, рН-метрическим) измерениям. Тогда никто не мешает включить в число неизвестных констант и константу формальной реакции получения отнесенной к базису частицы, активность которой мы измеряем. В логарифм этой константы войдет поправка, компенсирующая систематическую ошибку потенциометрических измерений.

Оценку для систематической ошибки сдвига аналитического состава раствора Ах1. можно получить из уравнений материального баланса для закрытой системы с учетом изменения состава паровой фазы

Загружаемые угли сушили в промышленных условиях с доведением остаточной влажности до 1-3%. Для получения индекса производительности на сухую массу /о экспериментальные величины корректировали, принимая относительное изменение индекса производительности равным 2,5% на каждый процент влажности. Выше говорилось, что этот коэффициент вариации , по-видимому, зависит от природы угля, поэтому получается систематическая ошибка в определении /ц, но она не превышает 1%. Напомним, что случайная ошибка средней загрузки (из шести) обычно составляет 2%, тогда общая ошибка - порядка 3%.

Внутренние возмущения, систематические ошибки измерения Отказ отдельных подсистем, аварии

Итак, величины / - содержат как ошибки измерений (будем считать их случайными), так и систематические ошибки, вызванные неадекватностью модели.

Еще раз напомним, что величины е, вычисляемые описанным выше способом, характеризуют только влияние случайных, но не систематических ошибок анализа. Анализ может оказаться совершенно неправильным, несмотря на хорошую точность, т, е, на малую величину е, если при анализе были какие-либо систе матические ошибки. Отсутствие систематических ошибок может быть установлено сопоставлением разницы между полученным при анализе средним арифметическим () и истинным содержанием (а) определяемого элемента , т, е. ошибки А=х - а с е. Если Д

Систематические ошибки иногда можно установить по наличию некоторой постоянной тенденции. Так, если отклонение экспериментальных данных от средних величин распределено не случайно, а имеет в условиях эксперимента постоянную тенденцию, то можно ожидать систематической ошибки. Такое отклонение имеет значение, если оно больше ожидаемой ошибки в определении Предварительное обнаружение систематических ошибок требует некоторых навыков, так как для этого необходимо знание природы шаучаемой системы.

Таким образом, небольшое значение е свидетельствует лишь о высокой точности измерений , но не об их правильности, так как все измерения могут содержать одну и ту же, и при этом значительную систематическую ошибку (например, вследствие неисправности прибора). Экспериментатор должен заранее позаботиться о том, чтобы такая ошибка была бы исключена (папример, устранением разрыва нити термометра Бекмапа).

Рассмотрим причины, влияющие на ошибку измерения на примере с объемом газа, который упоминался выше. Ошибка измеряемого объема слагается из систематической ошибки и случайной ошибки измерения . Систематическая ошибка характеризует методическую правильность измерения , тогда как случайная ошибка определяется конкретными условиями отдельного измерения. Допустим, например, что объем газа измерялся при помощи 50-миллиметровой газовой бюретки . Указанный вьшде объем

Систематические ошибки постоянны во всей серпи измерений или изменяются по определенному закону. Выявление их требует специальных исследований, но как только систематические ошибки обнаружены, они могут быть легко устранены введением соответствующих поправок в результаты измерения.

Дри исследовании одноосновной кислоты средней силы последнюю реакцию в матрице (1) можно не учитывать. Напротив, опуская

Ошибки измерения делятся на случайные (тот самый шум, о котором шла речь ранее) и систематические. Прояснить, что такое систематическая ошибка, можно на следующем примере: предположим, мы немного изменим в схеме по рис. 13.3 сопротивление резистора R2. При этом у нас на определенную величину сдвинется вся шкала измерений: показания термометра будут соответствовать действительности, только если мы прибавим (или вычтем, неважно) некоторую константу к полученной величине: / = /’ + 5, где / - «правильное» значение температуры (оно все же отличается от истинного значения из-за наличия случайной ошибки); /’ - показания термометра; 5 - величина систематической ошибки из-за сдвига шкалы. Более сложный случай систематической погрешности - если мы оставим R2 в покое, а немного изменим R5, то есть изменим наклон характеристики термометра, или, как еще это называют, крутизну преобразования. Это равносильно тому, что мы умножаем показания на некий постоянный множитель к, и «правильное» значение будет тогда определяться по формуле: t = ht\ Эти виды ошибок носят название аддитивной и мультипликативной погрешностей.

О систематических погрешностях математическая статистика «ничего не знает», она работает только с погрешностями случайными. Единственный способ избавиться от систематических погрешностей (кроме, конечно, подбора прецизионных компонентов) - это процедуры калибровки (градуировки), о них мы уже говорили в этой главе ранее.

Случайные ошибки измерения и их оценка

я предполагаю, что читатель знаком с таким понятием, как вероятность. Если же нет - настоятельно рекомендую книгу , которая есть переиздание труда от 1946 г. Расширить кругозор вам поможет классический учебник , который отличает исключительная внятность изложения (автор его, известный математик Елена Сергеевна Вентцель, кроме научной и преподавательской деятельности, также писала художественную литературу под псевдонимом И. Грекова). Более конкретные сведения о приложении методов математической статистики к задачам метрологии и обработки экспериментальных данных, в том числе с использованием компьютера, вы можете найти, например, в . Мы же остановимся на главном - расчете случайной погрешности.

В основе математической статистики лежит понятие о нормальном распределении. Не следует думать, что это нечто заумное - вся теория вероятностей и матстатистика, как прикладная дисциплина, в особенности, основаны на здравом смысле в большей степени, чем какой-либо другой раздел математики.

Не составляет исключения и нормальный закон распределения, который наглядно можно пояснить так. Представьте себе, что вы ждете автобус на остановке. Предположим, что автопарк работает честно, и надпись на табличке «интервал 15 мин» соответствует действительности. Пусть также известно, что предыдущий автобус отправился от остановки ровно в 10:00. Вопрос - во сколько отправится следующий?

Как бы идеально ни работал автопарк, совершенно ясно, что ровно в 10:15 следующий автобус отправится вряд ли. Пусть даже автобус выехал из парка по графику, но тут же был вынужден его нарушить из-за аварии на перекрестке. Потом его задержал перебегающий дорогу школьник. Потом он простоял на остановке из-за старушки с огромной клетчатой сумкой, которая застряла в дверях. Означает ли это, что автобус всегда только опаздывает? Отнюдь, у водителя есть план, и он заинтересован в том, чтобы двигаться побыстрее, потому он может кое-где и опережать график, не гнушаясь иногда и нарушением правил движения. Поэтому событие, заключающееся в том, что автобус отправится в 10.15, имеет лишь определенную вероятность, не более.

Если поразмыслить, то станет ясно, что вероятность того, что следующий автобус отправится от остановки в определенный момент, зависит также от того, насколько точно мы определяем этот момент. Ясно, что вероятность отправления в промежутке от 10.10 до 10.20 гораздо выше, чем в промежутке от 10.14 до 10.16, а в промежутке от 10 до 11 часов оно, если не возникли какие-то форс-мажорные обстоятельства, скорее всего, произойдет наверняка. Чем точнее мы определяем момент события, тем меньше вероятность того, что оно произойдет именно в этот момент, и в пределе вероятность того, что любое событие произойдет ровно в указанный момент времени, равна нулю.

Такое кажущееся противоречие (на которое, между прочим, обращал внимание еще великий отечественный математик Колмогоров) на практике разрешается стандартным для математики способом: мы принимаем за момент события некий малый интервал времени 5/. Вероятность того, что событие произойдет в этом интервале, уже равна не нулю, а некоей конечной величине бЛ а их отношение 5P/5t при устремлении интервала времени к нулю равна для данного момента времени некоей величине /?, именуемой плотностью распределения вероятностей. Такое определение совершенно аналогично определению плотности физического тела (в самом деле, масса исчезающе малого объема тела также стремится к нулю, но отношение массы к объему конечно) и потому многие понятия математической статистики имеют названия, заимствованные из соответствующих разделов физики.

Правильно сформулированный вопрос по поводу автобуса звучал бы так: каково распределение плотности вероятностей отправления автобуса во времени? Зная эту закономерность, мы можем всегда сказать, какова вероятность того, что автобус отправится в определенный промежуток времени.

Интуитивно форму кривой распределения плотности вероятностей определить несложно. Существует ли вероятность того, что конкретный автобус отправится, к примеру, позже 10:30 или, наоборот, даже раньше предыдущего автобуса? А почему нет - подобные ситуации в реальности представить себе очень легко. Однако ясно, что такая вероятность намного меньше, чем вероятность прихода «около 10:15». Чем дальше в обе стороны мы удаляемся от этого центрального наиболее вероятного срока, тем меньше плотность вероятности, пока она не станет практически равной нулю (то, что автобус задержится на сутки - событие невероятное, скорее всего, если такое случилось, вам уже будет не до автобусов). То есть распределение плотностей вероятностей должно иметь вид некоей колоколообразной кривой.

В теории вероятностей доказывается, что при некоторых предположениях относительно вероятности конкретных исходов нашего события, эта кривая будет иметь совершенно определенный вид, который называется нормальным распределением вероятностей или распределением Гаусса. Вид кривой плотности нормального распределения и соответствующая формула показаны на рис. 13.5.

Рис. 13.5. Плотность нормального распределения вероятностей

Далее мы поясним смысл отдельных параметров в этой формуле, а пока ответим на вопрос: действительно ли реальные события, в частности, интересующие нас ошибки измерения, всегда имеют нормальное распределение? Строгого ответа на этот вопрос в общем случае нет, и вот по какой причине. Математики имеют дело с абстракциями, считая, что мы уже имеем сколь угодно большой набор отдельных реализаций события (в случае с автобусом это была бы бесконечная таблица пар значений «плотность вероятности - время»). В реальной жизни такой ряд невозможно получить не только потому, что для этого потребовалось бы бесконечно долго стоять около остановки и отмечать моменты отправления, но и потому, что стройная картина непрерывного ряда реализаций одного события (прихода конкретного автобуса) будет в конце концов нарушена совершенно не относящимися к делу вещами: маршрут могут отменить, остановку перепестри, автопарк обанкротится, не выдержав конкуренции с маршрутными такси… да мало ли что может произойти такого, что сделает бессмысленным само определение события.

Однако все же интуитивно понятно, что, пока автобус ходит, какое-то, пусть теоретическое, распределение имеется. Такой идеальный бесконечный набор реализаций данного события носит название генеральной совокупности. Именно генеральная совокупность при некоторых условиях может иметь, в частности, нормальное распределение. В реальности же мы имеем дело с выборкой из этой генеральной совокупности. Причем одна из важнейших задач, решаемых в математической статистике, состоит в том, чтобы имея на руках две разных выборки, доказать, что они принадлежат одной и той же генеральной совокупности - проще говоря, что перед нами есть реализации одного и того же события. Другая важнейшая для практики задача состоит в том, чтобы по выборке определить вид кривой распределения и ее параметры.

На свете сколько угодно случайных событий и процессов, имеющих распределение, совершенно отличное от нормального, однако считается (и доказывается с помощью т. н. центральной предельной теоремы), что в интересующей нас области ошибок измерений при большом числе измерений и истинно случайном их характере, все распределения ошибок - нормальные. Предположение о большом числе измерений не слишком жесткое - реально достаточно полутора-двух дес5Гтков измерений, чтобы все теоретические соотношения с большой степенью точности соблюдались на практике. А вот про истинную случайность ошибки каждого из измерений можно говорить с изрядной долей условности: неслучайными их может сделать одно только желание экспериментатора побыстрее закончить рабочий день. Но математика тут уже бессильна.

Полученные опытным путем характеристики распределения называются оценками параметров, и, естественно, они будут соответствовать «настоящим» значениям с некоторой долей вероятности - наша задача и состоит в том, чтобы определить интервал, в котором могут находиться отклонения оценок от «истинного» значения и соответствующую ему вероятность. Но настало время все же пояснить - что же это за параметры?

в формуле на рис. 13.5 таких параметра два- величины ц и а. Они называется моментами нормального распределения (аналогично моментам распределения масс в механике). Параметр ц называется математическим ожиданием (или моментом распределения первого порядка), а величина а - средним квадратическим отклонением. Нередко употребляют его квадрат, обозначаемый как D или просто и носящий название дисперсии (или центрального момента второго порядка).

Математическое ожидание есть абсцисса максимума кривой нормального распределения (в нашем примере с автобусом это время 10:15), а дисперсия, как видно из рис. 13.5, характеризует «размытие» кривой относительно этого максимума- чем больше дисперсия, тем положе кривая. Этим моменты имеют прозрачный физический смысл (вспомните аналогию с фи^зическим распределением плотностей): математическое ожидание есть аналогия центра масс некоего тела, а дисперсия характеризует распределение масс относительно этого центра (хотя распределение плотности материи в физическом теле далеко от нормального распределения плотности вероятности).

Оценкой гпх математического ожидания ц служит хорошо знакомое нам со школы среднее арифметическое:

Здесь п- число измерений; /- текущий номер измерения (/= l,…,w); дс/ - значение измеряемой величины в /-м случае.

Оценка дисперсии вычисляется по формуле:

(2)

Оценка среднего квадратического отклонения, соответственно, будет:

Здесь (jc, – гПх) - отклонения конкретных измерений от ранее вычисленного среднего.

Следует особо обратить внимание, что сумму квадратов отклонений делить следует именно на « – 1, а не на «, как может показаться на первый взгляд, иначе оценка получится смещенной. Второе, на что следует обратить внимание - разброс относительно среднего характеризует именно среднее квадра-тическое отклонение, вычисленное по формулам (2) и (3), а не среднее арифметическое отклонение, как рекомендуют в некоторых школьных справочниках - последнее дает заниженную и смещенную оценку (не напоминает ли вам это аналогию со средним арифметическим и действующим значениями переменного напряжения?).

Заметки на полях

Кроме математического ожидания, средние значения распределения вероятностей характеризуют еще величинами, называемыми модой и медианой. В случае нормального распределения все три величины совпадают, но в других случаях они могут оказаться полезными: мода есть абсцисса наивероят-нейшего значения (то есть максимума на кривой распределения, что полностью отвечает бытовому понятию о моде), а медиана выборки есть такая точка, что половина выборки лежит левее ее, а вторая половина - правее.

В принципе этими формулами для расчета случайных погрешностей можно было бы ограничиться, если бы не один важный вопрос: оценки-то мы получили, а вот в какой степени они отвечают действительности? Правильно сформулированный вопрос будет звучать так: какова вероятность того, что среднее арифметическое отклоняется от «истинного» значения (то есть математического ожидания) не более чем на некоторою величину 8 (например, на величину оценки среднего квадратического отклонения s)?

Величина 5 носит название доверительного интервала, а соответствующая вероятность - доверительной вероятностью (или надежностью). Обычно решают задачу, противоположную сформулированной: задаются величиной надежности и вычисляют доверительный интервал 5. В технике принято задаваться величиной надежности 95%, в очень уж серьезных случаях - 99%. Простейшее правило для обычных измерений в этом случае таково: при уело-вии достаточно большого числа измерений (практически - более 15-20) доверительной вероятности в 95% соответствует доверительный интервал в 2Sy а доверительной вероятности в 99% - доверительный интервал в 3s. Это известное правило «трех сигма», согласно которому за пределы утроенного квадратического отклонения не выйдет ни один результат измерения, но на практике это слишком жесткое требование. Если мы не поленимся провести не менее полутора десятков отдельных измерений величины дс, то с чистой совестью можем записать, что результат будет равен

Систематические и случайные ошибки.

Измеряя любую физическую величину с помощью прибора с конкретной ценой деления w, нам приходилось округлять результат до ближайшего целого деления или хотя бы до значения, соответствующего середине между соседними делениями. Погрешность, которую мы считали равной , можно назвать по сути ошибкой округления . Эта ошибка присутствует всегда и включается в общий класс систематических ошибок. Можно ли ее уменьшить? Конечно, можно взять более дорогой и точный прибор.

Кроме ошибки округления существует предельная ошибка прибора , связанная с неточностью изготовления шкалы на заводе. Неужели кто-то поверил, что интервал на шкале линейки действительно соответствует 1 мм? Конечно нет. Цена деления миллиметровой линейки приблизительно равна 1мм. И эта приблизительность выражается в предельной ошибке, прописанной в заводском паспорте прибора. Допускаемая предельная погрешность, например, для стальной линейки длиной 300 мм составляет мм. И чем длиннее линейка, тем больше приборная погрешность. Для упрощения обработки данных, мы будем учитывать только ошибку округления и пренебрежем приборной.

При измерении интервалов времени с помощью секундомеров вводится систематическая ошибка, которая связана с реакцией человека на нажатие кнопки. Один человек медлителен от природы и нажимает кнопку на секундомере позже начала процесса, второй наоборот – слишком рано. Медицинские исследования этого вопроса дают среднее значение абсолютной погрешности измеряемого интервала с при нажатии кнопки в начале и в конце процесса. Такую ошибку называют субъективной . Вот оно что! Тогда понятен большой разрыв между двумя одновременными измерениями падения кирпича (см. 2.2.1). Его можно объяснить разной реакцией у меня и у моего напарника.

А какие еще ошибки бывают, кроме систематических?

Для ответа на этот вопрос проведем (мысленно) лабораторную работу по измерению дальности полета маленького шарика, выпущенного пружинным пистолетом под углом a к горизонту. Будем стрелять раз, при этом шарик будет оставлять следы на бумаге (для этого нужно всего лишь положить копировальную бумагу поверх простого листа).

Рис.19. Схема эксперимента по измерению дальности полета шарика.

Проведем черту А перпендикулярно оси пистолета (рис.19), соответствующую начальной координате шарика. Параллельно линии А проведем линию В через одну из точек-следов. Измерим расстояние х i между ними и будем называть эту величину дальностью полета. Запишем пример таких измерений:

Таблица 3. Измерения дальности полета шарика с помощью линейки.

х i , мм

Почему же результаты отличаются, ведь используется каждый раз один и тот же пистолет и один и тот же шарик? Чтобы не было ветра, я закрыл окно, а разброс данных остался. Может дело в пружине? Заряжая пистолет, каждый раз пружина сжимается немного по-разному? Может шарик каждый раз немного меняет свою траекторию в стволе? А вот это я уже не смогу никак учесть! Сжатие пружины и траектория шарика совершенно случайные величины в этой установке. Таким образом, разброс данных можно объяснить случайностью, и поэтому вводится класс случайных величин, а с ними вместе и особый вид случайных ошибок .

Для обработки набора данных случайной величины вводится среднее значение

и среднеквадратичное отклонение от среднего

Используя данные из табл.3, получим

Если кто-то думает, что списав все цифры с калькулятора, можно получить более точный ответ, я напомню о цене деления линейки и о систематической погрешности округления. Никакого смысла нет тащить за собой цифры в разрядах дальше десятых, потому что ошибка округления мм. И вообще можно ввести жесткое требование к количеству знаков в числах при рассчетах. В промежуточных рассчетах надо оставлять на одну цифру больше, чем количество цифр в исходных данных. Последняя цифра будет запасной и поможет в конце измерений сделать грамотное округление конечного результата. Таким образом, достаточно ограничиться значением

Добавим к табл.3 еще одну строку, где запишем отклонение каждого значения от среднего , т.е.

Таблица 4. Измерения дальности полета шарика с помощью линейки.

х i , мм
Δx i =x i – , мм	– 26,6	10,4	– 8,6	– 0,6	31,4	2,4	– 28,6	20,4

Отклонения от среднего могут быть как положительные, так и отрицательные. Это и понятно: среднее значение всегда лежит где-то посередине набора значений , поэтому оно больше одних значений и меньше других. Для рассчета среднеквадратичного отклонения надо сложить квадраты отклонений и разделить на , не забыв потом взять квадратный корень из результата:

Оказывается, если проделать несколько таких серий по 8 выстрелов, то в каждой серии будет свое среднее значение дальности полета , а среднеквадратичное отклонение этих средних значений будет намного меньше, чем (для простоты будем считать, что среднеквадратичные отклонения в каждой серии равны друг другу) и равно