Математическая статистика и её роль в медицине и здравоохранении (2)

Реферат

Математическая статистика и её связь с теорией вероятности;

  • Основные задачи и понятия математической статистики;
  • Определение выборки и выборочного распределения;
  • Графическое изображение выборки;
  • Определение понятие полигона и гистограммы;

Санитарная (медицинская) статистика — отрасль статистической науки

  • 2-

1. Математическая статистика — раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этом статистическими данными называют информацию о количестве объектов в более или менее обширном наборе, обладающих определенными характеристиками.

Предмет и метод математической статистики.

Статистическое описание агрегата, с одной стороны, и описание агрегата по его общим свойствам, которое вовсе не требует его расчленения на отдельные объекты, с другой. По сравнению с первым методом статистические данные всегда более или менее обезличены и имеют лишь ограниченную ценность в тех случаях, когда индивидуальные данные важны. С другой стороны, по сравнению с данными об общих свойствах совокупности, наблюдаемыми извне, статистические данные позволяют глубже понять суть дела. Например, данные гранулометрического анализа породы (т. е. данные о распределении образующих породу частиц по размерам) дают ценную дополнительную информацию по сравнению с испытанием не расчлененных образов породы, позволяя в некоторой мере объяснить свойства породы, условия ее образования и пр.

Метод исследования, основанный на рассмотрении статистических данных по определенным совокупностям объектов, называется статистикой. Статистический метод применяется в самых различных областях знания. Однако черты статистического метода в применении к объектам различной природы столь своеобразны, что было бы бессмысленно объединять, например, социально-экономическую статистику, физическую статистику, звездную статистику и т. п. в одну науку.

Общие черты статистического метода в различных областях знания сводятся к подсчету числа объектов, входящих в те или иные группы, рассмотрению распределения количественных признаков, применению выборочного метода (в случаях, когда детальное исследование всех объектов обширной совокупности затруднительно), использованию теории вероятностей при оценке достаточности числа наблюдений для тех или иных выводов и т. п. Эта формальная математическая

3 стр., 1378 слов

Методы оценки эффективности управления рисками инновационной деятельности

... их эффективность - Концептуально теория управления рисками инновационной деятельности базируется на математической теории вероятностей, являясь прикладным ее приложением. Поэтому основные показатели, применяемые при проверке и оценке рисков, используются правила математической статистики ...

  • 3-

сторона статистических методов исследования, безразличная к специфической природе изучаемых объектов, и составляет предмет математической статистики.

Связь математической статистики с теорией вероятностей

Связь математической статистики с теорией вероятностей в разных случаях носит разный характер. Теория вероятностей изучает не любые массовые явления, а явления случайные и именно «вероятностно случайные», т. е. такие, для которых имеет смысл говорить о соответствующих им распределениях вероятностей. Однако теория вероятностей играет определенную роль в статистическом исследовании массовых явлений любой природы, которые могут не принадлежать к категории вероятностно случайных. Это делается с помощью теории выборки и теории ошибок, основанной на теории вероятностей. В этих случаях вероятностным законам подчиняются не сами изучаемые явления, а методы их исследования.

Более важную роль в статистическом исследовании вероятностно случайных явлений играет теория вероятностей. Здесь в полной мере находят применение такие основанные на теории вероятностей разделы математической статистики, как проверка статистических гипотез, статистическое оценивание распределений вероятностей и входящих в них параметров и т. д. Область же применения этих более глубоких статистических методов значительно уже, т. к. здесь требуется, чтобы сами изучаемые явления были подчинены достаточно определенным вероятностным закономерностям. Например, статистическое исследование режима турбулентных потоков воды или колебаний в радиоприемниках основано на теории стационарных случайных процессов. Однако применение той же теории к анализу экономических временных рядов может привести к грубым ошибкам в виду того, что входящее в определение стационарного процесса допущение наличия сохраняющихся в течении длительного времени неизменных распределений вероятностей в этом случае, как правило, совершенно неприемлемо.

Вероятностные закономерности получают статистическое выражение (вероятности осуществляются приближенно в виде частот, а математические ожидания – в виде средних) в силу закона больших чисел.

  • 4-

2.ОСНОВНЫЕ ПОНЯТИЯ СТАТИСТИКИ

Объект исследования — область научного знания, в рамках которой выявляется и существует изучаемая проблема, это процесс или явление, порождающее проблемную ситуацию и выбираемое для изучения.

Тема исследования — это отдельная проблема в определенной области знаний, которую исследователь будет изучать и анализировать.

Цель исследования — желаемый конечный результат исследовательской деятельности. Цель исследования определяет тактику организации научной деятельности.

Задачи исследования — это перечень проблем, которые необходимо рассмотреть комплексно для полноценного анализа изучаемой темы.

Субъекты являются непосредственными исполнителями медико-статистических исследований. Статистическая популяция — это группа относительно однородных элементов в определенных условиях времени и пространства.

16 стр., 7832 слов

Диагностика вероятности банкротства организаций

... диагностики вероятности банкротства; изучение основных подходов к оценке вероятности банкротства в зарубежных методиках; Структурно работа состоит из введения, в котором осуществляется постановка цели и задач исследования, ... удержании или ликвидации должно приниматься в установленном законом порядке. Несостоятельность субъекта хозяйствования может быть [13, 110]: «несчастной», не по собственной вине, ...

В зависимости от охвата единиц наблюдения статистическая совокупность может быть:

  • генеральная — состоит из всех качественно однородных единиц наблюдения, которые могут быть к ней отнесены в зависимости от целей исследования;
  • выборочная — часть генеральной совокупности, отобранная специальным выборочным методом и предназначенная для характеристики генеральной совокупности.

Общий обзор

В статистике население представляет собой целую группу лиц, которые нас интересуют. Вообще, изучать целую популяцию довольно дорого и трудоемко, а в некоторых случаях просто невозможно, так как популяция может быть гипотетической, поэтому собирают данные по выборке индивидуумов, как предполагают, представителей этой популяции, и используют их для того, чтобы сделать выводы ( т.е. делать заключения) относительно этой популяции.

Когда берут выборку из популяции, имеют ввиду, что информация в выборке не может

  • 5-

полностью отражать то, что истинно в этой популяции. Возможна ошибка выборки, так как изучена только часть генеральной совокупности.

Далее мы обсудим, как использовать теоретическое распределение вероятностей для определения величины этой ошибки.

Репрезентативная выборка

Репрезентативная выборка (representative sample) — одно из ключевых понятий анализа данных. Репрезентативная выборка — это выборка из генеральной совокупности с распределением F(x), представляющая основные особенности генеральной совокупности.

Например, если в городе проживает 100 000 человек, половина из которых мужчины, а половина женщины, выборка из 1000 человек, включая 10 мужчин и 990 женщин, определенно не будет репрезентативной.

Построенный на его основе опрос общественного мнения, конечно же, будет содержать предвзятость в оценках и приведет к фальсификации результатов.

Необходимым условием построения репрезентативной выборки является равная вероятность включения в нее всех элементов генеральной совокупности.

Выборочная (эмпирическая) функция распределения дает при большом объеме выборки достаточно хорошее представление о функции распределения F(x) исходной генеральной совокупности.

Оценка параметров популяции: точечные оценки

Нас часто интересует оценка параметра в генеральной совокупности, среднего или стандартного отклонения. Обычно обозначают среднее популяции как , а стандартное отклонение популяции как .

В статистике принято обозначать популяционные параметры (генеральные) буквами греческого алфавита, а выборочные – соответствующими им буквами латинского алфавита, например, и m , и и т. д.

Мы оцениваем значение параметра, используя данные, собранные в выборке.

  • 6-

Эта оценка – точечная оценка генерального параметра ( т.е. она принимает только одно значение) в отличие от интервальной оценки, которая имеет интервал значений.

Точечную оценку описывает выборочная статистика.

Выборочная дисперсия, выборочное стандартное отклонение

Если вы повторите извлечение выборок одного и того же размера из генеральной совокупности, маловероятно, что оценки параметров генеральной совокупности будут в точности одинаковыми в каждой выборке. Однако все оценки должны быть близки к истинному значению параметра (генеральному параметру) в популяции и подобны друг другу.

31 стр., 15482 слов

Средние величины в статистике

... Условия применения средних величин в анализе Как упоминалось выше, предварительным условием для расчета средних значений для исследуемой популяции является ее однородность. Действительно, допустим, что отдельные элементы совокупности, вследствие подверженности ...

Определив степень изменчивости этих оценок, мы поймем, насколько они точны, а затем сможем оценить ошибку из-за выборки.

Обычно берут только одну выборку из популяции. Однако знания о теоретическом распределении выборочных оценок можно использовать, чтобы сделать выводы об общем параметре генеральной совокупности.

Выборочное стандартное отклонение s оценивается по наблюдаемой реализации выборки:

Стандартное отклонение отражает изменчивость значений данных, и его следует сообщать, если необходимо объяснить изменчивость в наборе данных.

Выборочное распределение среднего, ошибка среднего

Предположим, что мы заинтересованы в оценке среднего популяции; можно брать много повторных выборок объема n из популяции и оценить среднее в каждой выборке.

Если размер выборки достаточно велик, средние оценки обычно распределяются для любого распределения исходных данных в генеральной совокупности.

Данное утверждение следует из теоремы, известной как центральная предельная теорема:

→ N (0,1) при n → ∞

  • 7-

Если объем выборки небольшой, оценки среднего отвечают нормальному распределению при условии, что данные в популяции также отвечают нормальному распределению;

Среднее этих оценок – несмещенная оценка истинного среднего в популяции

(генерального среднего), т.е. среднее этих оценок эквивалентно истинному среднему в популяции;

  • Вариабельность распределения выражается стандартным отклонением оценок, известным как стандартная ошибка среднего (часто обозначают как Standard Error Means, SEM).

Если бы мы знали стандартное отклонение популяции σ, тогда стандартная ошибка среднего описывалась бы так:

В случае если есть, как обычно, только одна выборка, нашей лучшей оценкой среднего популяции будет выборочное среднее, а так как редко бывает известно стандартное отклонение в популяции (генеральный стандарт), то стандартную ошибку среднего оценивают следующим образом:

где s – стандартное отклонение в выборке.

Стандартная ошибка среднего отражает точность нашей оценки.

Большая стандартная ошибка указывает, что оценка неточна;

  • Небольшая стандартная ошибка указывает, что оценка точна;
  • Стандартная ошибка уменьшится, т.е. мы получим более точную оценку, если:
  • Объем выборки увеличится;
  • Данные имеют небольшое рассеяние.

Следовательно, стандартная ошибка представляет собой точность выборочного среднего и должна быть указана, если среднее значение набора данных представляет интерес.

  • 8-

3. Выборка (sample, set) — конечный набор прецедентов (объектов, случаев, событий, испытуемых, образцов, и т.п.), некоторым способом выбранных из множества всех возможных прецедентов, называемого генеральной совокупностью.

Если исследователь не имеет возможности контролировать выбор вариантов использования, обычно предполагается, что выбор вариантов использования является случайным. Если же выбором

6 стр., 2775 слов

Возможности анализа данных медико-биологических экспериментов ...

... вкладке Advaced позволяет вычислить следующие параметры описательной статистики: Valid N — общее число вариантов в выборке; Mean — среднее арифметическое; Sum - сумма всех значений ... по имени столбца в открывшемся диалоговом окне выбрать Values/Stats. Ошибки (выпадающие значение) могут попасть в минимальные или максимальные, а ошибки типа двойной запятой—выносятся в правый столбец. Рис.2—Типы данных ...

прецедентов можно управлять, то возникают задачи оптимального формирования выборки, см. также активное обучение, планирование экспериментов, выборочное обследование.

По каждому прецеденту собираются (измеряются) некоторые данные (data), образующие описание прецедента. Набор описаний всех вариантов использования выборки — это входная информация для статистического анализа данных, интеллектуального анализа данных и машинного обучения.

Термины выборка (sample, set) и данные (data) взаимозаменяемы; иногда они употребляются вместе как один термин выборка данных (data set).

Следовательно, анализ данных также можно понимать как анализ готовых образцов. Основные цели анализа данных:

  • проверка гипотез относительно имеющейся выборки данных;
  • эмпирическая индукция — выявление общих закономерностей, присущих всей генеральной совокупности, по имеющийся выборке данных;
  • прогнозирование — формирование статистически обоснованных предсказаний относительно новых данных, которые ещё не наблюдались.

Вероятностная модель порождения данных

Случайная выборка

Вероятностная модель генерации данных предполагает, что генеральная выборка населения формируется случайным образом. Объём (длина) выборки считается произвольной, но фиксированной, неслучайной величиной.

Формально это означает, что с генеральной совокупностью связывается вер оятностное пространство , где — множество всех

  • 9-

выборок длины , — заданная на этом множестве сигма-алгебра событий, — вероятностная мера, как правило, неизвестная.

Случайная выборка — это последовательность наблюдений, выбранных из набора в соответствии с вероятностной мерой .

Однородная выборка

Выборка называется однородной, если все ее прецеденты распределены одинаково, то есть если они выбраны из одного и того же распределения .