«Общая теория статистики» Автор работы ______________Нагаева А.Н

Курсовая работа

В современных условиях развития общества интерес к статистике как науке и ее широкое использование на практике значительно вырос. Сегодня никто не может отрицать важность и недооценивать роль статистики в общественной жизни. Статистические данные способствуют формированию адекватной картины текущей ситуации в стране. Благодаря этому в случае обнаружения отклонений или несоответствий появляется возможность своевременно принять ряд корректирующих мер и значительно улучшить ситуацию.

Статистика, как и любая другая наука, возникает из практических потребностей людей. Возникновение и развитие капитализма потребовало обширной и достоверной информации о состоянии производства, источниках сырья, рынках труда и сбыта продукции и т.п. Накоплен опыт сбора, систематизации и обработки первичных статистических материалов. их анализ должен выявить закономерности социального развития.

Систематическая статистика — залог качественного и профессионального управления, показатель грамотного руководителя. Любой новый бизнес строится, прежде всего, на оценке существующих фактов, состояния дел в этом секторе. Коренные экономические преобразования, связанные с переходом менеджмента к рыночным условиям, изменили статистическую систему, действующую в России. Страна вынуждена стремительно и активно включиться в работу по адаптации к международным стандартам. Изменились методики статистического учета. Разрабатываются новые методы сбора и обработки статистической информации.

Важной задачей статистики является расчет величины прожиточного минимума и определение численности населения. Имея доходы ниже черты бедности, собирая информацию о распределении пенсионеров по размеру пенсий, работающих на предприятиях всех форм собственности — по уровню получаемой заработной платы, продолжительности рабочего времени, отпусков.

Статистика изучает формирование новых отношений собственности, ее приватизацию, развитие новых форм хозяйствования и видов предпринимательской деятельности. При этом, наряду с количественными измерениями формирования смешанной экономики, существенно расширяется информация о качественных показателях предприятий различных форм собственности и управления для проведения сравнительного анализа эффективности их деятельности.

Роль и значение статистики в развитии общества, в научном познании окружающего мира и в управлении бизнесом подчеркивается системой и типами статистических показателей.

Без статистической информации невозможно понять закономерности природных и социальных массовых явлений, спрогнозировать их, а затем регулировать или контролировать контроль, будь то на уровне отдельного предприятия, города или региона, на государственном или межгосударственном уровне.

7 стр., 3454 слов

Смешанные формы детективной и охранной деятельности

... Частная охранная деятельность Предприятие, которое в соответствии со свои уставом занимается организацией охранных услуг, обязано иметь на то лицензию, выдаваемую органами внутренних дел. Охранная деятельность ... заключения с клиентом договора на сбор такой информации частный следователь обязан письменно уведомить ... внутренних дел выдает документ установленной формы, удостоверяющий его личность. Частные ...

Курсовая работа разделена на три раздела: средства и индикаторы вариации, корреляционный анализ и регрессионный анализ.

Основными задачами данной курсовой работы являются:

  • проведение корреляционного анализа;
  • – определение средних величин и показателей вариации;
  • – проведение регрессионного анализа. Целью данной курсовой работы является решение задач по каждому из разделов.

1. Средние величины и показатели вариации

Большое распространение в статистике имеют средние величины. Средние величины характеризуют качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др. Средняя — это один из распространенных приемов обобщений. Правильное понимание сущности среднего определяет его особую значимость в условиях рыночной экономики, когда среднее через единичное и случайное позволяет выделить общее и необходимое, выявить тенденцию законов экономического развития.

Среднее значение является обобщающим показателем, который выражает действие общих условий, моделей исследуемого явления.

Статистические средние рассчитываются на основе массовых данных правильно статистически организованного массового наблюдения (сплошного и выборочного).

Однако статистическая средняя будет объективна и типична, если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений).

Например, если вы рассчитываете среднюю заработную плату в кооперативах и государственных предприятиях и распространяете результат на все население, то среднее значение является фиктивным, поскольку оно рассчитывается для неоднородного населения и это среднее значение теряет всякий смысл.

С помощью среднего как бы сглаживаются различия в значении атрибута, возникающие по той или иной причине в отдельных единицах наблюдения. Например, средняя выработка продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, здоровья и т.д.

Средняя выработка отражает общее свойство всей совокупности. Среднее значение является отражением значений изучаемого признака, поэтому оно измеряется в том же размере, что и этот признак.

Каждое среднее значение характеризует исследуемую популяцию по любому критерию. Чтобы иметь полную и исчерпывающую картину изучаемого населения с точки зрения ряда существенных характеристик, в общем, необходимо иметь систему средних значений, которая может описывать явление с разных сторон.

Существуют различные средние:

1. средняя арифметическая;

2. средняя геометрическая;

3. средняя гармоническая;

4. средняя квадратическая;

5. средняя хронологическая.

Рассмотрим некоторые виды средних, которые наиболее часто

используются в статистике.

Средняя арифметическая

Средняя арифметическая простая (невзвешенная) равна сумме отдельных значений признака, деленной на число этих значений.

Отдельные значения признака называют вариантами и обозначают через

31 стр., 15482 слов

Средние величины в статистике

... величина; в) средняя геометрическая величина; г) средняя квадратическая, кубическая и т.д. величины. 3. По охвату совокупности: а) групповая средняя величина; б) общая средняя величина. Средние величины различаются в зависимости от учета признаков, влияющих на осредняемую величину: Если среднее значение ... возможностей статистического анализа социальных процессов. Поэтому средние значения часто ...

х( ); число единиц совокупности обозначают через n, среднее

значение признака — через . Следовательно, средняя арифметическая

простая равна:

(1.1)

Основные свойства средней арифметической.

Средняя арифметическая обладает рядом свойств:

1. Уменьшая или увеличивая частоту каждого значения атрибута x в n раз, среднее арифметическое значение не изменится.

Если все частоты разделить или умножить на любое число, среднее значение не изменится.

2. Общий множитель индивидуальных значений признака может быть вынесен за знак средней:

(1.2)

3. Средняя суммы (разности) двух или нескольких величин равна сумме

(разности) их средних:

(1.3)

4. Если х = с, где с — постоянная величина, то .

5. Сумма отклонений значений признака Х от средней арифметической х

равна нулю:

Характеристики серии вариаций вместе со средним значением — это мода и медиана.

Мода — это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для серий с дискретным распределением режимом будет значение варианта с наибольшей частотой.

Для интервальных рядов распределения с равными интервалами мода определяется по формуле:

(1.4)

где — начальное значение интервала, содержащего моду;

  • величина модального интервала;
  • частота модального интервала;
  • частота интервала, предшествующего модальному;
  • частота интервала, следующего за модальным. Медиана

Рассмотрим расчет медианы в интервальном вариационном ряду. Медиана интервального вариационного ряда распределения определяется по формуле [6,54-58]

(1.5)

где — начальное значение интервала, содержащего медиану;

  • величина медианного интервала;
  • — сумма частот ряда;
  • сумма накопленных частот, предшествующих медианному интервалу;
  • частота медианного интервала.

Понятие вариации признаков. Показатели вариации.

Информации о средних уровнях изучаемых показателей, как правило, недостаточно для глубокого анализа изучаемого процесса или явления. Следовательно, необходимо учитывать разброс значений отдельных единиц населения.

Объемы спроса и предложения, процентные ставки в разные периоды времени подвержены значительным колебаниям.

Разница в индивидуальных значениях признака в популяции, изучаемой статистикой, называется вариацией признака.

Вариация – это изменение (колеблемость) значений признака внутри совокупности. Величина знаков меняется под влиянием различных причин и явлений.

Поскольку изменение (колеблемость) признаков, бывает большей или меньшей возникает задача измерения ее величины.

Измерение вариации признака необходимо при: определении надежности средних величин, результатов выборочных наблюдений для различных совокупностей и т.д.

Для измерения величины разброса статистики используются различные показатели, которые обычно делятся на абсолютные и относительные.

Абсолютные индикаторы вариации включают: диапазон вариации, среднее линейное отклонение, вариацию хода и стандартное отклонение.

Размах вариации (R) – представляет собой разность между max и min значениями признака в изучаемой совокупности.[4,25-29]

4 стр., 1742 слов

Применение показателей вариации в статистическом исследовании

... относительные показатели. К абсолютным показателям вариации относятся: размах колебаний; среднее линейное отклонение; среднее квадратическое отклонение; дисперсия; квартильное отклонение. Размах колебаний (размах вариации) где x mах , xmin - соответственно максимальное и минимальное значения признака. Значение индикатора ...

R = X max – X min(1.6)

Задача 1.1

По статистическим данным: 3; 5; 2; 4; 7; 3; 8; 3; 10 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение увеличить на свой номер классного журнала. Дисперсия до одного знака после запятой; среднеквадратическое — до двух; коэффициент вариации — до одного в процентах.

Решение

Преобразуем значения, увеличив их на 14, и получим следующие данные: 17; 19;16;18;21;17;22;17;24.

Определим среднее значение. Для этого сложим все статистические

17+19+16+18+21+17+22+17+24 данные и поделим на их количество: x̅= = 19 (1).

Чтобы определить моду, необходимо определить значение, которое часто встречается. Таким образом, мода равна 17.

Для определения медианы строки необходимо расположить в порядке возрастания. Получим: 16; 17; 17; 17; 18; 19; 21; 22; 24. Количество значений нечетное, следовательно, медианой будет являться число 18, т. к. оно занимает центральное положение среди совокупности упорядоченных значений.

∑n

i=1(xi −x)²

Далее, определим среднюю дисперсию: σ²(s²) = =

n (17−19)2 +(19−19)2 +(16−19)2 +(18−19)2 +(21−19)2 +(17−19)2 +(22−19)2 +(17−19)2 +(24−19)²

≈6,7

Теперь вычислим среднеквадратическое отклонение:

σ =√σ² = √6,7 = 2,58(1.1.9)

Наконец, найдем коэффициент вариации :

2,58

V= × 100% = 13,6 % (1.2.6).

Задание 1.2

По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 21%, стоимость основных фондов увеличилась на 10%. Определить изменение фондоотдачи. Увеличьте значения дохода и стоимость основных средств номера вашего классного журнала.

Решение

Доход от реализации

Фондоотдача находится по формуле: Ф = ,

Стоимость основных фондов

ее измененение определяется по следующей формуле:

Темп роста дохода от реализации ∆Ф = × 100% – 100%

Темп роста ст.осн.фондов

Подставив все данные в формулу, предварительно увеличив значения дохода и стоимости основных фондов на номер классного журнала (14), получим:

∆Ф =  100%  100%  8,87%

Таким образом, произошло увеличение фондоотдачи на 8,87%.

Задание 1.3

Объем оборота (У) и число работников (m) приведены в таблице 1. Определить среднее значение, моду и медиану. Таблица 1 – Исходные данные У 80-100 100-120 120-140 140-160 160-180 180-200

m 6 17 25 28 14 10

Решение Таблица 1.1 – «Промежуточные решения»

У 80-100 100-120 120-140 140-160 160-180 180-200

m 6 17 25 28 14 10

Накоп.частота 6 23 48 76 90 100

У 90 110 130 150 170 190

m∙ У 540 1870 3250 4200 2380 1900

У/2 45 55 65 75 85 95

Для начала определим общее число работников. Оно будет составлять 100 человек.

Определим среднее значение по следующей формуле:

∑ m∙У̅ 540+1870+3250+4200+2380+1900

x̄=∑n = = 141,4 (1.1.1)

m 1 i 100

Кроме того, для определения медианы и режима необходимо найти средний интервал.

Медианным интервалом будет интервал 140-160, так как накопленная

20 стр., 9956 слов

Функции и формы статистической таблицы. Основные элементы и правила построения

... содержанию индикаторов в таблице. Таблица имеет общее заглавие (название), определяющее ее содержание. В статистической таблице есть подлежащее и сказуемое. Подлежащим статистической таблицы называется объект ... преимущества социалистической системы хозяйства. 2. Виды статистических таблиц. В зависимости от конструкции предмета статистические таблицы делятся на три типа: простые, групповые ...

∑n

i=1 mi 100 частота на этом промежутке превысит значение = =50. (76 >50).

2 2

Теперь можно найти медиану:

n

−ms−1 50−48

Ме = хн + i ∙ ( 2

=140+20 ∙ ( )=141,43 (1.1.4)

mме 28

Определяем моду:

m2−m1 28−25

М0 = хн + i ∙ [ (m2−m2)+(m2−m3)] = 140 + 20∙[ ] =143,53 (1.1.5)

28−25+28−14

Задание 1.4

По таблице определяют среднюю внутригрупповую, межгрупповую и общую дисперсию, а также коэффициент детерминации. В таблице: Х – объем оборота предприятий, млн. руб., mг – число государственных предприятий; mч – частных; mо – общее число (таблица 2).

Каждое значение Хi увеличить на свой номер классного журнала.

Решение

Увеличив значение Хi на номер классного журнала (14), получим следующие данные: Таблица 1.2 – Исходные данные по объему оборота предприятий

Хi mгi mчi moi

15,0-15,2 3 3

15,2-15,4 4 4

15,4-15,6 17 17

15,6-15,8 11 15 26

15,8-16,0 13 6 19

16,0-16,2 18 5 23

16,2-16,4 6 6

16,4-16,6 2 2

50 50 100

Для удобства нахождения общей дисперсии построим таблицу с найденными промежуточными значениями. Таблица 1.3 – Данные для вычисления групповой дисперсии Хi mгi mчi moi Х ср.i Х ср i∙ moi

(Хср.i-X̅o)2 (Хср.i-X̅o)² ×moi

15,0-15,2 3 3 15,1 45,3 0,509796 1,529388 15,2-15,4 4 4 15,3 61,2 0,264196 1,056784

15,4-15,6 17 17 15,5 263,5 0,098596 1,676132

15,6-15,8 11 15 26 15,7 408,2 0,012996 0,337896

15,8-16,0 13 6 19 15,9 302,1 0,007396 0,140524

16,0-16,2 18 5 23 16,1 370,3 0,081796 1,881308

16,2-16,4 6 6 16,3 97,8 0,236196 1,417176

16,4-16,6 2 2 16,5 33 0,470596 0,941192

???? 50 50 100 1581,4 8,9804

Найдем общее среднее значенне. Используем следующую формулу:

 х ср.i  m oi 1581,4

Х0    15,814 млн. руб. (1.1.1)

 m oi 100

Найдем общую дисперсию по следующей формуле:

 

 ( х ср.  х общ ) 2  m oi 8,9804

  0,089804 , т.е. 89 804 руб. (1.2.1)

 m oi 100

Рассчитаем дисперсию для mгi и mчi. Для этого построим, аналогично первой таблице, чтобы выявить дисперсию государственных и частных предприятий. Таблица 1.4 – Внутригрупповая дисперсия для частных предприятий

Хi mчi Хср.i Хср.i∙mчi (Хср.i-X̅ч)² (Хср.i-X̅ч)²∙mчi

15,0-15,2 3 15,1 45,3 0,278784 0,836352

15,2-15,4 4 15,3 61,2 0,107584 0,430336

15,4-15,6 17 15,5 263,5 0,016384 0,278528

15,6-15,8 15 15,7 235,5 0,005184 0,07776

15,8-16,0 6 15,9 95,4 0,073984 0,443904

16,0-16,2 5 16,1 80,5 0,222784 1,11392

Σ 50 781,4 3,1808

Найдем среднее значение частных предприятий:

̅ ч = ∑ Xср i∙mчi = 781,4 = 15,628 (1.1.1)

X ∑ mчi 50

Определим дисперсию:

∑(Xcрi −X̅ ч )²∙mчi 3,1808

σ2 = ∑ mчi

= = 0,063616, т. е. 63616 руб. (1.2.1) Таблица 1.5 – «Внутригрупповая дисперсия для государственных предприятий»

Хi mгi Хср.i Хср.i∙mгi (Хср.i-X̅г)² (Хср.i-X̅г)²∙mгi

15,6-15,8 11 15,7 172,7 0,09 0,99

6,8-16,0 13 15,9 206,7 0,01 0,13

16,0-16,2 18 16,1 289,8 0,01 0,18

32 стр., 15814 слов

Содержит страниц рисунка таблиц использованных источника приложения

... системы мотивации персонала компании «А» в целом. Предметом исследования являются пути совершенствования системы ... влиять задатки, система ценностей, опыт, обучение. Продолжение таблицы 1 Запас ... мотивация» более широкое и оно может включать в себя понятие «стимулирование» Как средство усиления мотивов стимулирование принято подразделять на две взаимосвязанные формы:  Материальное;  Нематериальное. ...

16,2-16,4 6 16,3 97,8 0,09 0,54

16,4-16,6 2 16,5 33 0,25 0,5

???? 50 800 2,34

Аналогично найдем среднее государственных предприятий и ее внутригрупповую дисперсию:

̅ г = 800 = 16 млн.руб. (1.1.1)

X

2,34

σ2 = = 0,0468, т.е. 46800 руб. (1.2.1).

Далее, найдем среднюю внутригрупповую дисперсию, путем суммирования дисперсий государственного и частного предприятий и делением на 2:

46800+63616

σ̅ вг. = = 55208 руб.

Как известно, общая дисперсия равна сумме среднегрупповой и межгрупповой дисперсий, следовательно можно выразить межгрупповую дисперсию:

σ²мг= σ²обш — σ̅вг= 89804 – 55208 = 34596 руб.

Далее определим коэффициент детерминации:

σ²мг 34596

η² = 2 ∙ 100% =  100%  38,52%

σобщ 89804

Задание 1.5

Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).

Таблица 1.6 — Исходные данные 1 — группа

Хi 1 2 8

mi 30 15 5

2 — группа

Хi 1 6

mi 10 15

3 — группа

Хi 3 8

mi 20 5

Построим таблицу, для выявления общей дисперсии Таблица 1.7 – «Данные для выявления общей дисперсии» Хi 1 2 3 moi Х∙moi ̅0)2

(X − X ̅0)2∙moi

(X − X

группа группа группа

(m1i) (m2i) (m3i)

1 30 10 40 40 4 160

2 15 15 30 1 15

3 20 20 60 0 0

6 15 15 90 9 135

8 5 5 10 80 25 250

Σ 100 300 560

∑ Х∙moi 300

Далее, определим среднее общее значение : х̅о= ∑ = =3 (1.1.1)

moi 100

∑(Х−Х̅ o)²∙moi 560

Определим общую дисперсию: σ²общ = ∑ moi

= =5,6 (1.2.1)

Определим дисперсию для каждой группы в отдельности. Для удобства, построим для каждой группы свои таблицы. Таблица 1.8 – «Вычисление дисперсии для первой группы»

Хi 1 группа Х∙m1i ̅1)2

(X − X ̅1)2∙m1i

(X − X

(m1i)

1 30 30 1 30

2 15 30 0 0

8 5 40 36 180

Найдем среднее общее значение для первой группы (X) и дисперсию (????2):

∑ X∙ m1i 100

̅

X1= = = 2 (1.1.1)

∑ m1i 50

∑(Х−X̅ 1 )²∙m1i 30+180

σ2 = ∑ m1i

= = 4,2 (1.2.1)

Построим таблицу для вычисления дисперсии для второй группы. Таблица 1.9 – Вычисление дисперсии для 2 группы Xi m2i Х∙m2i (X − ̅

X2)2 (X − ̅

X2)2∙m2i

1 10 10 9 90 6 15 90 4 60

∑ Х∙m2i 100

Среднее значение : X̅2= ∑ m2i

= =4

̅ 2 )²∙m2i

∑(Х−X 150

Дисперсия: σ²2= ∑ m2i

= =6 Таблица 1.10 – Вычисление дисперсии для 3 группы

Xi

m3i Х∙m3i (X − ̅

X3)2 (X − ̅

X3)2∙m3i

3 20 60 1 20 8 5 40 16 80

∑ Х∙m3i 100

Среднее значение : X̅2= ∑ m3i

= = 4 (1.1.1)

16

̅ 3 )²∙m3i

∑(Х−X 100 Дисперсия: σ²3= ∑ m3i

= = 4 (1.2.1) Наконец, вычислим среднюю внутригрупповую дисперсию:

4,2+6+4 σ̅²в= =4,73 И межгрупповую: σ²мг=σ²о− σ̅²в= 5,6 − 4,73 = 0,87.

2.Корреляционный анализ

В социально- экономических исследованиях используют вероятностные (статистические) связи. Чтобы оценить тесноту связи между индикатором и фактором или между двумя факторами, используйте момент корреляции или коэффициент корреляции.

3 стр., 1390 слов

Основные принципы этикета и его значение

... скромности, терпимости, доброжелательности. В современном этикете выделяют четыре основных принципа: 1. принцип гуманизма и человечности, который ... сам листок с надписью. Исходя из значения «надпись» развилось более узкое значение - «нота, обозначающая последовательность церемониальных ... корреляцией между ними в общем могут существовать как бы в разных, практически не пересекающихся плоскостях. Этикет ...

Как правило, на значение показателей влияет несколько факторов, поэтому для оценки силы взаимосвязи между показателем и факторами используется множественный корреляционный анализ. На основе статистических данных корреляционный момент определяется: ???????????? = ∑(???????? + ????̅) ∙ ∑(???????? + ????̅) (2), где n – объем выборки, число наблюдений;Xi ,

????

Yi – i-тое значение фактора и показателя; X̅, Y – средние значения фактора и показателя.

В виду того, что корреляционный момент имеет размерность, то переходят к безразмерному коэффициенту корреляции:

  • Kxy rxy = (2.1.1), где ????Х ; ????У – среднеквадратические отклонения фактора и

????Х ∙????У

показателя.

Для расчета коэффициента корреляции, на практике используется следующая зависимость:

̅̅̅̅

ХУ−Х ̅∙У

̅ rxy = (2.1.2), где XY – среднее значения произведения фактора на

????Х ∙????У

показатель.

Коэффициент корреляции изменяется в пределах: -1≤ r ≤+1

Значимость коэффициента корреляции базируется на проверке статистических гипотез, выдвигается нулевая гипотеза о том, что коэффициент корреляции равен нулю и контр гипотеза, что он не равен нулю: H0: r=0; H1: r ≠ 0. После этого определяется расчетное значение критерия Стьюдента по

r√????−2 формуле: t = (2.1.3).

Далее находится табличное значение критерия

√1−???? 2

Стьюдента. Входными данными для табличного значения является уровень значимости ???? а степень свободы ????. На практике, чаще всего, ???? принимают за 0; 0,5; ???? = n−2. Если рассчитанное значение критерия Стьюдента больше табличного значения, нулевая гипотеза отклоняется и, следовательно, коэффициент корреляции значим. Если, с другой стороны, табличное значение критерия Стьюдента больше, чем вычисленное значение критерия, то нулевая гипотеза подтверждается, и, следовательно, коэффициент корреляции не имеет значения.

Также для расчетов в этом разделе используется коэффициент ранговой

6∙∑ d² корреляции Спирмена: ???? = 1 − (2.1.4)

????∙(????2 −1)

∑(хi−x̅ )(yi−y̅ )

Корреляционный момент: Кху = (2.1.5)

????

Задание 2.1

Определить коэффициент корреляции между У и Х.

Х: 3,5; 4,6; 5,8; 4,2; 5,2;

  • УХ:28,35;
  • 43,24;
  • 65,54;
  • 28,98;
  • 50,44.

Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Сначала он определяет Y, затем увеличивает Y и X на номер журнала класса. Результаты:

1) коэффициент корреляции;

2) расчетное и табличное значения критерия Стьюдента и вывод.

Решение

Увеличив Y и X на номер классного журнала (14) получим Таблица 2.1 – «Промежуточное решение»

X 17,5 18,6 19,8 18,2 19,2

Y 22,1 23,4 25,3 20,9 23,7

XY 386,75 435,24 500,94 380,38 455,04

49 стр., 24467 слов

Труда, коэффициент эффективности

... мотивации труда и её роли в повышении эффективности деятельности персонала ДОУ; исследовать существующие способы по совершенствованию системы мотивации педагогических сотрудников ДОУ; разработать методические рекомендации по совершенствованию системы мотивации персонала ДОУ в ... достижению целей компании. Их влияние распространяется на действия персонала, профессиональная и трудовая деятельность ...

(Xi − ̅

X)2 1,3456 0,0036 1,2996 0,2116 0,2916

(Yi − ̅

Y) 2 0,9604 0,1024 4,9284 4,7524 0,3844

Определим средние значения для X,Y и XY:

∑X 93,3

X̅= = = 18,66 (1)

n 5

∑y 115,4

Y= = = 23,08

n 5

∑ XY 2158,35

̅̅̅̅

ХУ = = = 431,67

n 5

Определим дисперсии для X и Y:

∑(Хi−Х̅ )² 3,152

σ²Х = = = 0,6304 (1.2)

n 5

∑(Уi−У̅ )² 11,128

σ²У= = = 2,2256

n 5

Далее, найдем коэффициент корреляции:

̅̅̅̅

ХУ−Х ̅∙У

̅ 431,67−430,67

rxy = = ≈ 0,84 (2.1.2).

σХ ∙σУ √0,6304∙2,2256

Определим расчетное значение критерия Стьюдента. Для его вычисления необходим показатель степени свободы. В данной задаче:

f= 5–2 =3.

Расчетное значение критерия Стьюдента:

r∙√f 0,84∙√3

t= = = 2,7 (2.1.3).

√1−r2 √1−0,84 2

Табличное значение критерия Стьюдента: ????(0,05;3) = 3,18

Следовательно, коэффициент корреляции не имеет значения, поскольку табличное значение теста Стьюдента больше, чем рассчитанное значение теста Стьюдента, и, следовательно, нулевая гипотеза подтверждается.

Задание 2.2

Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х).

Оценить его значимость. Исходные данные: х: 18 22 13 20 15 14 у: 17 20 11 18 14 10 Это нулевой вариант. Каждое значение х и у увеличить на свой номер классного журнала. Результаты: 1.Коэффициент корреляции. 2.Расчетное и табличное значения критерия Стьюдента, вывод о значимости. Все результаты должны быть до 2-х знаков после запятой.

Решение

Увеличим каждое значение x и y на номер классного журнала (14), получим: Таблица 2.2 – «Промежуточные вычисления»

X 32 36 27 34 29 28

Y 31 34 25 32 28 24

ХY 992 1224 675 1088 812 672 (Xi − ̅

X)2

1 25 16 9 4 9 (Yi − ̅

Y)2

4 25 16 9 1 25

Найдем среднее значение X и Y, а также среднее значения их произведения:

∑X 186

X̅= = = 31 (1)

n 6

∑Y 174

Y= = = 29

n 6

̅̅̅̅ = ∑ XY = 5463 = 910,5

ХУ

n 6

Определим дисперсии для X и Y:

∑(Хi−Х̅ )² 74

σ²Х = = = 10,67 (1.2)

???? 6

∑(Уi−У̅ )² 80

σ²У= = =13,33

???? 6

Вычислим коэффициент корреляции:

̅̅̅̅

ХУ−Х ̅∙У

̅ 910,5−899

rxy = = = 0,96 (2.1.2).

σХ ∙σУ √10,67∙13,33

Определим расчетное значение критерия Стьюдента. Для его вычисления необходим показатель степени свободы. В данной задаче:

f= 6 – 2 =4.

Расчетное значение критерия Стьюдента:

????∙√???? 0,96∙2

????= = = 6,86 (2.1.3).

√1−???? 2 √1−0,962

Табличное значение критерия Стьюдента: ????(0,05;4) = 2,78

Таким образом, коэффициент корреляции значим, т.к табличное значение критерия Стьюдента меньше расчетного значения этого критерия, а нулевая гипотеза отвергается.

Задание 2.3

В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по стобалльной системе:

7 стр., 3165 слов

Китайская модель управления

... управления становится все ближе и ближе к тому, что было бы без «американской модели». Он становится «естественным». Во всех значениях этого слова. Он базируется на единстве. Менеджмент в Китае ... сторон. Слаженность. Стремление Лидера к достижению широкого консенсуса в команде проистекает из методов управления самого Китая. Духовность. В Китае духовное начало и материальность неразрывны. Было бы ...

Теория вероятностей: 65 90 42 47 84 58 50

Статистика: 51 85 36 63 72 80 40.

Определите коэффициент ранговой корреляции Спирмена и его значимость. Это нулевой вариант. Каждое значение (балл) увеличить на свой номер классного журнала. Расчеты и результат до двух знаков.

Результаты:

1.Коэффициент ранговой корреляции.

2.Расчетные и табличные значения критерия Стьюдента при уровне значимости 0,05 и выводы.

Решение

Для того, чтобы вычислить ранговый коэффициент корреляции Спирмена необходимо ранжировать баллы, полученные студентами, по двум предметам (теория вероятностей и статистика).

Затем мы определяем квадрат разницы в рейтингах по соответствующим дисциплинам для каждого из студентов.

Увеличим каждое значение на номер классного журнала (14).

Для удобства расчетов строим таблицу с промежуточными расчетами. Таблица 2.3 – «Промежуточные расчеты ранговой корреляции Спирмена»

№ студента 1 2 3 4 5 6 7

Теория вероятностей 79 104 56 61 98 72 64

Статистика 65 99 50 77 86 94 54

Ранг (Rтв) 5 7 1 2 6 4 3

Ранг (Rст) 3 7 1 4 5 6 2

d² 4 0 0 4 1 4 1

Найдем значение степени свободы. Оно составит:

f = 7 – 2 =5

Количество ранжируемых элементов: n = 7

Коэффициент корреляции Спирмена:

6∙∑ d² 6∙14

???? =1− =1− =0,75 (2.1.4)

????∙(????2 −1) 7∙48

Таким образом, коэффициент корреляции Спирмена выявил тесную прямую связь. Определим его значимость. Для этого необходимо табличное значение критерия значимости Спирмена со степенью значимости α/2=0,025 (0,02): ????(0,02;5) = 0,833. Следовательно, рассчитанное значение критерия корреляции Спирмена меньше табличного значения критерия. Это означает, что нулевая гипотеза подтверждена, а это означает, что коэффициент ранговой корреляции Спирмена не имеет значения.

Далее рассчитаем значение коэффициента Стьюдента. Для его расчета необходимы дополнительные расчеты, представленные в таблице 6.1. Таблица 2.4 – Расчет коэффициента корреляции Стьюдента № студента 1 2 3 4 5 6 7 ????

Теория

79 104 56 61 98 72 64 534 вероятностей (x)

Статистика (y) 65 99 50 77 86 94 54 525

хi-x̅ 2,71 27,71 -20,29 -15,29 21,71 -4,29 -12,29

yi-y̅ -10,00 24,00 -25,00 2,00 11,00 19,00 -21,00

(хi-x̅)(yi-y̅) -27,14 665,14 507,14 -30,571 238,86 -81,43 258 1530

(хi-x̅)² 7,36735 768,082 411,51 233,653 471,51 18,3673 150,939 2061,43

(yi-y̅)² 100 576 625 4 121 361 441 2228

534

Среднее значение баллов по теории вероятности: х̅ = = 76,29

Определим корреляционный момент:

∑(xi −x̅ )(yi −y̅ ) 1530

Кху = = = 218,57 (2.1.5)

???? 7

Вычислим дисперсии:

∑(xi −x̅ )² 2061,43

σ²х = = = 294,49 (1.2)

???? 7

∑(yi −y̅ )² 2228

σ²y = = = 318,29

???? 7

Коэффициент корреляции:

Kxy 218,57

rxy = = = 0,714 (2.1.1)

σx ∙σy √294,49∙318,29

Определим расчетное значение критерия Стьюдента:

r∙√f 0,714∙√5

t= = = 2,28 (2.1.3)

√1−r2 √1−3,282

Затем определим табличное значение критерия: t (0,05;5) = 2,57

Таким образом, можно сделать вывод, что коэффициент корреляции не является значимым, поскольку табличное значение критерия Стьюдента больше расчетного критерия.

3.Регрессионный анализ

Регрессионный анализ представляет из себя статистический метод влияния одной или нескольких зависимых переменных X, на независимую переменную Y. Кроме того, независимые переменные рассматриваются как регрессоры или предикторы, а зависимые переменные называются критериальными переменными.[2]

В ходе регрессионного анализа решаются две основные задачи:

  • построение уравнения регрессии, т.е. нахождение вида зависимости между результатным показателем и независимыми факторами x1, x2, …, xn.
  • оценка значимости полученного уравнения, т.е.

определение того, насколько выбранные факторные признаки объясняют вариацию признака у.

Регрессионный анализ в основном используется для планирования, а также для разработки нормативной базы.[6]

В отличие от корреляционного анализа, который отвечает только на вопрос о том, существует ли связь между анализируемыми характеристиками, регрессионный анализ также дает ее формализованное выражение. Кроме того, если корреляционный анализ изучает любую взаимосвязь факторов, то регрессионный — одностороннюю зависимость, т.е. связь, показывающую, каким образом изменение факторных признаков влияет на признак результативны.[7]

При решение задач данного раздела, нам понадобятся следующие формулы и модели:

  • линейная модель: y= a0+a1x (3)

ХУ ̅̅̅̅̅∙У

̅̅̅̅− (????) ̅

  • нахождение коэффициента а1 модели: а1 = ̅̅̅̅ ̅̅̅̅)²

2 − (????

(3.1.1)

????

̅ − а1 ∙ (????̅) (3.1.2)

  • нахождение коэффициента a0 модели: a0 = У

√????(????−????)²

  • стандартная ошибка : Sy= (3.1.3)

√????−2

????(y−ŷ)²

  • коэффициент детерминации: R 2 = 1- (3.1.4)

????(y−y̅)²

|????1 | |????0 |

  • критерий Стьюдента для коэффициентов: ????????1 = ; ????????0 = (3.1.5)

????????1 ????????0

???????? √∑ Х² ????????

  • случайные отклонения a1 и a0: ????????0 = ; ????????1 = (3.1.6)

????∙????Х √????∙????Х

????²∙(????−2)

  • критерий Фишера : ???? = (3.1.7)

1−????²

  • стандартное отклонение: ???????? = √̅̅̅̅

???? 2 − ????̅² (3.1.8)

∑(????−????̂???? )2

  • стандартная ошибка: ???????? = √ (3.1.9)

????−2

Задание 3.1

Построить нелинейную обратную модель связи себестоимости единицы продукции (y) со стоимостью основных фондов (x).

Определить характеристики модели.

Каждое значение (y) увеличить на свой номер классного журнала. Таблица 3.1 – Исходные данные x 1 2 3 4 5 6 7 8 9 10

y 21 16 15 14 13 12,5 11 11,5 10 8

Характеристики модели:

1) модель (коэффициенты до 4-х знаков);

2) индекс детерминации (до 2-х знаков)

3) стандартную ошибку (до 4-х знаков)

4) расчетное значение критерия Фишера (до 2-х знаков) и вывод о значимости модели;

5) вывод о значимости коэффициентов модели;

6) доверительные интервалы коэффициентов модели (до 4-х знаков Решение

Прежде всего, увеличим все имеющиеся данные на номер моего классного журнала (14).

Для удобства расчета построим таблицу с промежуточным расчетом. Введем замену: 1/х обозначим как Х Таблица 3.2 – Промежуточные расчеты коэффициентов модели

№ Y X Х(1/x) yХ X2 ŷi

1 35 1 1 35 1 35,82725

2 30 2 0,5 15 0,25 29,72681

3 29 3 0,333 9,657 0,11 27,68926

4 28 4 0,25 7 0,0625 26,67658

5 27 5 0,2 5,4 0,04 26,06654

6 26,5 6 0,167 4,4225 0,027889 25,66391

7 25 7 0,143 3,575 0,020449 25,37109

8 25,5 8 0,125 3,188 0,015625 25,15147

9 24 9 0,111 2,654 0,012321 24,98066

10 22 10 0,1 2,2 0,01 24,84645

∑ 272 55 2,929 88,109 1,549673 272

Ср. знач. 27,2 5,5 0,293 8,811 0,1549673

1) Зная данные значения, можно вычислить коэффициент a0 и коэффициент а1, для модели, которую необходимо поcтроить:

̅̅̅̅ ̅̅̅̅̅∙У

ХУ− (????) ̅ 8,811−0,293∙27,2

а1 = ̅̅̅ ̅̅̅̅)²

= = 12,2009 (3.1.1) — показывает среднее

x2 − (???? 0,1549673−0,293∙0,293

изменение результативного показателя с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 12,2009.

̅ − а1 ∙ (X

а0 = У ̅) = 27,2 – 12,2009 ∙ 0,293 = 23,6264(3.1.2) — формально показывает прогнозируемый уровень у, но только в том случае, если х0 находится близко с выборочными значениями.

Но если х0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

По имеющимся данным можно построить модель. Она будет иметь следующий вид:

12,2009

ŷ = 23,6264 +

X

Определим каждое значение ŷ.

Далее построим еще одну таблицу для нахождения следующих показателей: Таблица 3.3 – Расчет показателей индекса детерминации, стандартной ошибки № y Х ŷ (y-y̅)² (y-ŷ)² (X − ̅

X)2

1 35 1 35,82725 60,84 0,6843478 20,25

2 30 2 29,72681 7,84 0,0746353 12,25

3 29 3 27,68926 3,24 1,7180501 6,25

4 28 4 26,67658 0,64 1,7514363 2,25

5 27 5 26,06654 0,04 0,8713535 0,25

6 26,5 6 25,66391 0,49 0,6990511 0,25

7 25 7 25,37109 4,84 0,1377047 2,25

8 25,5 8 25,15147 2,89 0,1214734 6,25

9 24 9 24,98066 10,24 0,9616884 12,25

10 22 10 24,84645 27,04 8,1022621 20,25

∑ 272 55 272 118,1 15,122003 82,5

Ср. знач. 27,2 5,5 27,2 11,81 8,25

По данной таблице определим коэффициент детерминации:

Σ(y−ŷ)² 15,122003

R2 = 1– = 1– = 0,87 (3.1.4) — показывает долю вариации

Σ(y−y̅ )² 118,1

результативного признака, объясненную вариацией факторного признака.

2) Следовательно, можно вычислить индекс детерминации (R), он равен: R = √0,87 = 0,93. В нашем примере связь между знаком Y и фактором X очень высока и очевидна.

По данной таблице рассчитаем стандартную ошибку модели, а также расчетное значение критерия Фишера:

3) Соответственно, стандартная ошибка :

√Σ(y−ŷ)² 15,122003

Sy= = = 1,3749 (3.1.3)

√n−2 √8

4) Критерий Фишера (F) :

R²∙(n−2) 0,87∙8

F= = = 53,54 (3.1.7)

1−R² 1−0,87

Найдем табличное значение коэффициента Фишера. Оно будет равно 5,32 при значимости α=0,05 и критерием f = 8 . Уравнение регрессии с вероятностью 0,95 статистически значимое, так как F > Fтаб.

5) Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается нулевая гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.

Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля, для генеральной совокупности используют статистические методы проверки гипотез.

В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.

Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05.

H0: b = 0, то есть между переменными x и y отсутствует линейная взаимосвязь в генеральной совокупности;

  • H1: b ≠ 0, то есть между переменными x и y есть линейная взаимосвязь в генеральной совокупности.

Если основная гипотеза оказывается неверной, мы принимаем альтернативу. Для проверки этой гипотезы используется t-критерий Стьюдента.

Вычислим стандартные отклонения величин параметров модели:

σX = √̅̅̅ ̅² = √0,1549673 − 0,293 ∙ 0,293 =0,263(3.1.8)

X2 − X

Далее определим случайные отклонения a0 и а1:

Sy √∑ Х² 1,3749√0,1549673

Sa0 = = =0,6507(3.1.6)

n∙σХ 10∙0,263

Sy 1,3749

Sa1 = = =1,653

√n∙σХ √10∙0,263

Далее определим критерий Стьюдента для коэффициентов:

|a1 | 12,2009

t a1 = = =7,380955068 (3.1.5)

Sa1 1,653

|a0 | 23,6264

t a0 = = =36,30760478

Sa0 0,6507

Фактические значения t – статистики для параметров ????0 , ????1 превышают табличные:

  • t a0 =36,31 ˃ t табл = 2,306;
  • t a1 =7,38 ˃ t табл =2,306

поэтому параметры ????0 и а1 статистически значимы, нулевая гипотеза отвергается.

6) Рассчитаем доверительные интервалы для параметров регрессии a0 и а1. Определим предельную ошибку для каждого показателя:

∆a0 = t табл

  • Sa0 = 2,306·0,6507 = 1,5005

∆a1 = t табл

  • Sa1 = 2,306·1,653 = 3,8118

Доверительные интервалы:

Таким образом, доверительный интервал для а0:

23,6264–1,5005˂ a0˂23,6264+1,5005

22,1258˂ a0˂25,1269

12,2009 – 3,8118˂ a1˂12,2009+ 3,8118

8,3891< а1<16,0127

Следовательно, на основании анализа верхней и нижней границ доверительных интервалов можно сделать вывод, что параметры 0 и 1 с вероятностью 95% попадут в указанные пределы интервалов.

Задание 3.2

Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:

X 1 2 3 4 5 6

Y 10 13,4 15,4 16,5 18,6 19,1

Определить характеристики модели.

Каждое значение (y) увеличить на свой номер классного журнала.

Характеристики модели:

1) модель (коэффициенты до 2-х знаков)

2) индекс детерминации (до 2-х знаков)

3) стандартную ошибку ( до 4-х знаков);

4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и

вывод о значимости модели.

Решение

Увеличим значения y на номер классного журнала (14) и построим таблицу с промежуточными решениями. Таблица 3.4 – Промежуточные решения у,% х, тыс. дол. lnx (lnx)² ylnx

24 1 0 0 0

27,4 2 0,69 0,48 18,91

29,4 3 1,1 1,21 32,34

30,5 4 1,39 1.93 42,40

32,6 5 1,61 2,59 52,49

33,1 6 1.79 3,2 59,25

∑ 177 21 6,58 9,41 205,39

Определим а0 и а1 для построения модели:

6∙Σylnx−Σy∙Σlnx 6∙205,39−177∙6,58

а1 = = = 5,14

6∙Σ(lnx)2 −Σlnx∙Σlnx 6∙9,41−6,582

(Σy – Σlnx ∗ a1) 177−6,58∙5,14

а0 = = = 23,8615

6 6

Далее, найдя коэффициенты, можем построить модель: ŷ = 23,86 + 5,14lnx

Для расчета индекса детерминации, как и для других показателей, построим еще одну таблицу с промежуточными расчетами. Таблица 3.5 – Расчет индекса детерминации

№ Y X ŷ (y-y̅)² (y-ŷ)²

1 24 1 23,8615 30,25 0,0192

2 27,4 2 27,4091 4,41 0,0001

3 29,4 3 29,5171 0,01 0,0137

4 30,5 4 31,0082 1 0,2582

5 32,6 5 32,1393 9,61 0,2123

6 33,1 6 33,0647 12,96 0,0012

∑ 177 21 177,00 58,24 0,5047

Ср. знач. 29,5 3,5

2) По найденным значениям определим индекс детерминации:

̂)2

∑(y −y 0,5047

R = √1 − ∑(yi ̅)2

= √1 − =0,99

i −y 58,24

Получается, что связь между признаком Y и фактором X высокая и прямая.

3) Определим стандартную ошибку:

̂t )2

∑(y−y 0,5047

σε = √ =√ =0,3552 (3.1.9)

n−2 4

4) Проведем оценку значимости уравнения регрессии с помощью Fкритерия Фишера:

R2 0,99 F  ( n  2)   (6  2)  396

1 R 2 1  0,99

По таблице Фишера определим критическое значение F-критерия при уровне значимости α=0,05 и числе степеней свободы k1 = 1, k2 = n – 2 = 6 – 2 = 4. Fкр=7,71.

Поскольку наблюдаемое значение критерия больше табличного значения F = 396 Fcr = 7,71, следовательно, с вероятностью 0,95 уравнение регрессии считается статистически значимым.

Задание 3.3

Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1. Таблица 3.6 – Динамика коэффициента рождаемости в Пензенской области Год 2000 2001 2002 2003 2004 2005 Коэффициент 7,5 7,5 8,0 8,4 8,6 8,4 рождаемости Год 2006 2007 2008 2009 2010 2011 Коэффициент 8,6 9,7 10,2 10,3 10,2 10,1 рождаемости Год 2012 2013 2014 2015 2016 Коэффициент 10,8 10,6 10,8 10,7 10,2 рождаемости

Построить трендовую линейную регрессионную модель. Определите коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. В электронную таблицу вместо года ставить 1,2,…

Решение

1) Построим линейную модель У(t) = а0 + аit, параметры которой:

а1 

 (t  t )  ( у t  у) ; а 0  у  а1  t

 (t  t) 2 Промежуточные расчеты представим в таблице 3.2 Таблица 3.7 – Промежуточные расчеты.

et Год T У t — t̅ (t-t̅ )² y-y̅ (t-t̅ )(y-y̅) ур y-ŷ (y-ŷ)² y

100 (y-y̅)² 2000 1 7,5 -8 64 -1,947 15,576 7,692 -0,192 0,03694 2,56 3,791 2001 2 7,5 -7 49 -1,947 13,629 7,912 -0,412 0,16933 5,49 3,791 2002 3 8 -6 36 -1,447 8,6824 8,131 -0,131 0,01713 1,64 2,094 2003 4 8,4 -5 25 -1,047 5,2353 8,350 0,050 0,00248 0,59 1,096 2004 5 8,6 -4 16 -0,847 3,3882 8,570 0,030 0,00092 0,35 0,718 2005 6 8,4 -3 9 -1,047 3,1412 8,789 -0,389 0,15132 4,63 1,096 2006 7 8,6 -2 4 -0,847 1,6941 9,008 -0,408 0,16671 4,75 0,718 2007 8 9,7 -1 1 0,2529 -0,253 9,228 0,472 0,22307 4,87 0,064 2008 9 10,2 0 0 0,7529 0 9,447 0,753 0,56686 7,38 0,567 2009 10 10,3 1 1 0,8529 0,8529 9,666 0,634 0,40145 6,15 0,728 2010 11 10,2 2 4 0,7529 1,5059 9,886 0,314 0,09872 3,08 0,567 2011 12 10,1 3 9 0,6529 1,9588 10,105 -0,005 0,00003 0,05 0,426 2012 13 10,8 4 16 1,3529 5,4118 10,325 0,476 0,22610 4,40 1,83 2013 14 10,6 5 25 1,1529 5,7647 10,544 0,056 0,00315 0,53 1,329 2014 15 10,8 6 36 1,3529 8,1176 10,763 0,037 0,00135 0,34 1,83 2015 16 10,7 7 49 1,2529 8,7706 10,983 -0,283 0,07986 2,64 1,57 2016 17 10,2 8 64 0,7529 6,0235 11,202 -1,002 1,00400 9,82 0,567 Σ 153 160,6 0 408 0 89,5 160,6 0 3,14943 59,281 22,78 Ср.

9 9,4471 знач.

89,5

????1 = = 0,219 , соответственно ????0 =9,4471–0,219·9 = 7,476

Отсюда уравнение линейного тренда принимает окончательный вид: ŷt=0,219t +7,476

Положительное значение коэффициента t указывает на наличие тенденции к росту, и темп роста составляет в среднем 0,219 единицы в год.

2) Определим коэффициент детерминации:

̂)2

∑(y−y 3,14943

R2 = 1 − ∑(y−y̅)2 = 1 − = 0,8617 – т.е. в 86,17 % случаев изменения

22,78

х приводят к изменению y. Другими словами – точность подбора уравнения регрессии — высокая. Остальные 13.83% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

3) Определим стандартную ошибку:

̂)2

∑(y−y 3,14943

σε = √ =√ =0,4582 (3.1.9)

n−2 15

4) Оценим значимость модели с помощью критерия Фишера:

R2 ∙(n−2) 0,8617∙15

F= = =93,46.

1−R2 1−0,8617

Табличное значение критерия со степенями свободы k1=1 и k2=15, Fтабл = 4,54. Поскольку F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

5) Определим ошибку аппроксимации:

1 |y−y̅|

ε= ∙∑ ∙100% = 3,492%.

n y

В среднем, расчетные значения отклоняются от фактических на 3,49%. Поскольку ошибка составляет менее 7%, это уравнение можно использовать как регрессию.

6) Спрогнозируем коэффициент рождаемости в 2017 :

ŷ2017=0,219·18+7,476 = 11,4.

Задание 3.4

Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = а о + а1t; lnу = ао + а1t; у = 1/(ао + а1t).

Определите коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В таблице вместо года напишите 1,2,… По стандартной ошибке выберите лучшую модель и спрогнозируйте цену одного доллара в декабре 2017 года. Таблица 3.8 – Курс рубля к доллару Месяц и год январь февраль Март апрель май Июнь июль август

2017 2017 Цена одного 59,6 58,5 58,0 56,4 57,0 57,9 59,7 59,6 доллара

Решение

1) Построим уравнение линейного тренда курса доллара, которое имеет вид: ????̂???? = ????0 + ????1 ????, где a0 и a1 найдем из системы нормальных уравнений. (МНК) :

n ⋅ a0 + ∑ t ∙ a1 = ∑ y

{

∑ t ∙ a0 + ∑ t 2 ∙ a1 = ∑ ty

Все промежуточные расчеты представлены в таблице 3.2.1 Таблица 3.2.1 – промежуточные расчеты к линейной модели регрессии.

T Цена (y) t-t̅ y-y̅ (t-t̅ )( y-y̅) (t-t̅ )² ŷ y-ŷ (y-ŷ)² et

100 (y-y̅)²

y

1 59,6 -3,5 1,2625 -4,41875 12,25 58,075 1,525 2,325625 2,5587 1,5939 2 58,5 -2,5 0,1625 -0,40625 6,25 58,15 0,35 0,1225 0,59829 0,0264 3 58 -1,5 -0,3375 0,50625 2,25 58,225 -0,225 0,050625 0,38793 0,1139 4 56,4 -0,5 -1,9375 0,96875 0,25 58,3 -1,9 3,61 3,36879 3,7539 5 57 0,5 -1,3375 -0,66875 0,25 58,375 -1,375 1,890625 2,41228 1,7889 6 57,9 1,5 -0,4375 -0,65625 2,25 58,45 -0,55 0,3025 0,94991 0,1914 7 59,7 2,5 1,3625 3,40625 6,25 58,525 1,175 1,380625 1,96817 1,8564 8 59,6 3,5 1,2625 4,41875 12,25 58,6 1 1 1,67785 1,5939  36 466,7 0 0 3,15 42 466,7 0 10,6825 13,92196 10,91875 Сред. знач 58,3375 58,3375 4,5

∑(t−t̅)(у−у̅)

а1 = ∑(t−t̅)²

=0,075. тогда : a0= 58,3375 – 4,5·0,075 = 58

Таким образом, линейная модель будет выглядеть как: у̂ = 0,075???? + 58

1.1) Определим коэффициент детерминации:

̂)2

∑(y−y 10,6825

R2 = 1 − ̅)2

∑(y−y

=1− =0,0216.

10,91875

̂)2

(y−y 10,6825

1.2) Определим стандартную ошибку: σε = √ =√ =1,3343.

n−2 6

1.3) Определим значимость модели используя критерий Фишера:

R2 ∙(n−2) 0,0216∙6

F= = = 0,1325.

1−R2 1−0,0216

Табличное значение критерия со степенями свободы k 1=1 и k2=6, Fтабл = 5,99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

1.4) Вычислим ошибку аппроксимации:

1 |y−y̅| 13,92196

ε = ∙∑ ∙ 100% = =1,74 – в среднем, расчетные значения

n y 8

отклоняются от фактических на 1,74%. Поскольку ошибка составляет менее 7%, это уравнение можно использовать как регрессию.

Осуществим прогноз на декабрь 2017 года: ????̂

12 =12·0,075+58=58,9

2) Построим регрессионную модель вида: lnу = ао + а1t. Все промежуточные расчеты приведем в таблице 3.2.2. Для удобства расчета проведем замену: lny=У Таблица 3.2.2 – Промежуточные расчеты для модели lnу = ао + а1t

Цена ̂ ̂ ̅ ̂ )2 ̅)2 et t У t² tУ У У−У У−У (У − У (У − У 100

(y) y

1 59,6 4,0877 1 4,0877 4,061592 0,02611 0,02165 0,0006817 0,000468723 0,6387455 2 58,5 4,069 4 8,138 4,062865 0,00613 0,00295 0,00003758 0,0000087025 0,15065127 3 58 4,0604 9 12,1812 4,064139 -0,00374 -0,00565 0,00001399 0,0000319225 0,09210915 4 56,4 4,0325 16 16,13 4,065413 -0,03291 -0,03355 0,00108307 0,001125603 0,81611903 5 57 4,0431 25 20,2155 4,066687 -0,02359 -0,02295 0,000556488 0,000526703 0,58346318 6 57,9 4,0587 36 24,3522 4,067961 -0,00926 -0,00735 0,0000857 0,00005402 0,22815187 7 59,7 4,0893 49 28,6251 4,069235 0,02007 0,02325 0,000402805 0,000540563 0,49079305 8 59,6 4,0877 64 32,7016 4,070508 0,01719 0,02165 0,000295496 0,000468723 0,42052988 ∑36 466,7 32,5284 204 146,4313 32,5284 0 0 0,003156901 0,00322496 3,42056294 Ср. знач 58,3375 4,06605 25,5 18,3039 4,06605 4,5

̅̅̅̅̅

t∗У−t̅∗У ̅ 18,3039−4,5∙4,06605

а1 = ̅

2 2

= =0,00127;

t −(t̅) 25,5−4,5∙4,5

a0 = 4,06605 – 4,5·0,00127 = 4,0603.

Таким образом, модель будет иметь вид:

lny = 0,00127t + 4,0603

2.1) Определим коэффициент детерминации:

̂ )2

∑(У−У 0,003156901

R =1− ̅ )2

∑(У−У

=1− =0,0211.

0,00322496

2.2) Определим стандартную ошибку:

(У−У) ̂ 2

0,003156901

σε = √ =√ =0,0299.

n−2 6

2.3) Определим значимость модели, используя критерий Фишера:

R2 ∙(n−2) 0,0211∙6

F= = =0,1293.

1−R2 1−0,0211

Табличное значение критерия со степенями свободы k 1=1 и k2=6, Fтабл = 5.99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (найденная оценка уравнения регрессии статистически не надежна).

2.4) Вычислим ошибку аппроксимации:

1 ̅|

|У−У 3,42056294

ε = ∙∑ ∙ 100% = =0,4276 – в среднем, расчетные

n У 8

значения отклоняются от фактических на 0.43%. Поскольку ошибка составляет менее 7%, это уравнение можно использовать как регрессию.

12∗0,00127381+4,060318

Осуществим прогноз на декабрь: ????̂

12 = ???? =58,9

3) Построим регрессионную модель вида: у =1/(ао + а1t).

Все промежуточные расчеты приведем в таблице 3.2.3. Для удобства расчета проведем замену : 1/у = У Таблица 3.2.3 – Промежуточные расчеты для модели у = 1/(ао + а1t) t Цена У t² tУ ̂

У y-ŷ (y-ŷ)² ̅ )2

(У − У et

(y) 100

y 1 59,6 0,0168 1 0,0168 58,11138 1,48862 2,21599 1,59391 2,49768 2 58,5 0,0171 4 0,0342 58,16772 0,33228 0,11041 0,02641 0,56801 3 58 0,0172 9 0,0516 58,22416 -0,22416 0,05025 0,11391 0,38649 4 56,4 0,0177 16 0,0708 58,28072 -1,88072 3,53710 3,75391 3,33461 5 57 0,0175 25 0,0875 58,33738 -1,33738 1,78860 1,78891 2,34629 6 57,9 0,0173 36 0,1038 58,39416 -0,49416 0,24419 0,19141 0,85347 7 59,7 0,0168 49 0,1176 58,45105 1,24895 1,55988 1,85641 2,09205 8 59,6 0,0168 64 0,1344 58,50804 1,09196 1,19237 1,59391 1,83214  36 466,7 0,1372 204 0,6167 466,4746 0,22538 10,69879 10,91875 13,9107 Ср. 58,3375 0,01715 25,5 0,0770875 58,30933 знач. 4,5

̅tУ

̅̅̅−t̅∙У

̅ 0,0770875−4,5∗0,01715

а1 = = = − 0,0000167;

t̅2 −(t̅)2 25,5−4,5∗4,5

a0 = 0,01715 + 4,5·0,0000167 = 0,017225.

Таким образом, модель будет иметь вид:

у̂ 

0,017225  0,0000167t

2.1) Определим коэффициент детерминации:

̂ )2

∑(У−У 10,69879

R =1− ̅ )2

∑(У−У

=1− =0,02014.

10,91875

2.2) Определим стандартную ошибку:

(У−У) ̂ 2

10,69879

σε = √ =√ =1,335.

n−2 6

2.3) Определим значимость модели, используя критерий Фишера:

R2 ∙(n−2) 0,02014∙6

F= = = 0,1233.

1−R2 1−0,02014

Табличное значение критерия со степенями свободы k 1=1 и k2=6, Fтабл = 5.99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

2.4) Вычислим ошибку аппроксимации:

1 |У−У̅ | 13,9107

???? = ∙∑ ∙ 100% = =1,7388 в среднем, расчетные значения

???? У 8

отклоняются от фактических на 1,73%. Поскольку ошибка составляет менее 7%, это уравнение можно использовать как регрессию.

Осуществим прогноз на декабрь: ŷ

12 = =58,7

12∙(−0,0000167)+0,017225

Лучшая модель, судя по величине стандартной ошибки (наименьшая) является: lny = 0,00127t + 4,0603

Задание 3.5

По статистическим данным таблицы 3.3 определить средние величины, структурные средние и показатели вариации. Постройте линейную модель зависимости индикатора от времени и оцените ее качество. Номер страны соответствует номеру студента по классному журналу.

Таблица 3.3.1 — КУРСЫ ИНОСТРАННЫХ ВАЛЮТ ПО ОТНОШЕНИЮ К РОССИЙСКОМУ РУБЛЮ1) (на конец года; рублей за единицу иностранной валюты)

Страна Наименование 2010 2011 2012 2013 2014 2015

валюты

австралийский 31,55 28,96 45,91 53,12 1.Австралия доллар 31,01 32,72 2.Австрия Евро 40,33 41,67 40,23 44,97 68,34 79,70

азербайджанский 38,74 41,78 71,84 46,74 3.Азербайджан манат 38,11 40,98 4.Армения армянский драм 84,132) 83,742) 75,372) 80,712) 12,103) 15,053) 5.Беларусь белорусский рубль 10,162) 38,564) 35,344) 34,314) 38,804) 38,954) 6.Бельгия Евро 40,33 41,67 40,23 44,97 68,34 79,70 7.Германия Евро 40,33 41,67 40,23 44,97 68,34 79,70 8.Дания датская крона 54,105) 56,065) 53,955) 60,315) 92,025) 10,68 9.Испания Евро 40,33 41,67 40,23 44,97 68,34 79,70 10.Италия Евро 40,33 41,67 40,23 44,97 68,34 79,70 11.Казахстан3) Тенге 20,68 21,69 20,21 21,31 30,83 21,52 12.Канада канадский доллар 30,49 31,57 30,54 30,55 48,40 52,57 13.Киргизия3) Сом 64,84 69,56 64,08 66,34 95,52 94,84 14. Нидерланды Евро 40,33 41,67 40,23 44,97 68,34 79,70 15.Норвегия5) норвежская крона 51,61 53,64 54,53 53,21 75,79 83,38 16.Республика молдавский лей 25,07 27,52 25,10 25,08 36,03 37,06 Молдова5) 17. Соединенное Королевство (Великобритания) фунт стерлингов 47,26 49,63 48,96 53,96 87,42 107,98 18.США доллар США 30,48 32,20 30,37 32,73 56,26 72,88 19. Таджикистан Сомони 69,225) 67,665) 63,735) 69,095) 10,76 10,99

новый туркменский 10,65 11,48 19,74 21,44 20.Туркмения манат 10,70 11,29 21.Турция турецкая лира 19,60 16,83 16,97 15,30 24,27 25,08 22.Узбекистан2) узбекский сумм 18,58 17,94 15,30 14,63 23,22 26,45 23.Украина5) Гривна 38,28 40,05 37,59 39,72 35,56 30,46 24.Финляндия Евро 40,33 41,67 40,23 44,97 68,34 79,70 25.Франция Евро 40,33 41,67 40,23 44,97 68,34 79,70 26.Швеция5) шведская крона 44,81 46,61 46,69 50,15 72,02 87,26 27.Япония3) Иена 37,38 41,50 35,15 31,06 47,06 60,51

1)

По данным Банка России.

2)

За 1000 единиц национальной валюты.

3)

За 100 единиц национальной валюты.

4)

За 10 000 единиц национальной валюты.

5)

За 10 единиц национальной валюты.

Решение

Рассмотрим страну, соответствующую моему номеру классного журнала(14).

Таблица 3.3.2 – Курс валюты по отношению к российскому рублю

Страна Наименование валюты 2010 2011 2012 2013 2014 2015

14. Нидерланды Евро 40,33 41,67 40,23 44,97 68,34 79,70

40,33+41,67+40,23+44,97+68,34+79,70

Определим средний курс: x̅ = 6

= 52,54 руб.

Мода — это значение характеристики, которая чаще всего повторяется в совокупности. В данном случае мода отсутствует, поскольку каждое значение встречается всего один раз.

Определим медиану. Ранжируем ряд данных: 40,23; 40,33; 41,67; 44,97; 68,34; 79,70.

41,67+44,97

Ме = = 43, 32.

∑n

i=1(xi −x)²

Найдем дисперсию: σ2 = = 243,8979333.

n

Определим среднее квадратическое отклонение:

σ = √σ2 = √243,8979333 ≈ 15,61723194руб.

Рассчитаем коэффициент вариации:

σ 15,61723194

V = ̅ ∙ 100% = ∙ 100% =29,72%.

x 52,54

Построим линейную модель связи показателя со временем, которое будет выглядеть следующим образом: ŷt = a0 + a1 t , где t — год.

Таблица 3.3.3 – Расчеты данных уравнения тренда Год t У t-t̅ y-y̅ (y-y̅)(t-t)̅ (t-t̅ )² (y-y̅)²

40,33 –12,21 30,525 149,0841 2010 1 -2,5 6,25

2011 2 41,67 -1,5 –10,87 16,305 2,25 118,1569

2012 3 40,23 -0,5 –12,31 6,155 0,25 151,5361

2013 4 44,97 0,5 –7,57 –3,785 0,25 57,3049

68,34 15,80 23,7 249,64 2014 5 1,5 2,25

2015 6 79,70 2,5 27,16 67,9 6,25 737,6656

∑ 21 315,24 140,8 17,5 1463,3876

Среднее 52,54

3,5 значение

Определим а1 и a0:

∑(????−????̅)(у−у̅ )

а1 = ∑(????−????̅)²

≈ 8,0457

a0 = 52,54 – 3,5·8,0457 ≈ 24,3801

Таким образом, линейная модель имеет вид: у̂ = 24,3801 +8,0457t

Положительное значение коэффициента при t указывает на то, что имеется тенденция роста курса AMD, причем величина прироста ежегодно составляет в среднем 8,0457 руб.

Для анализа полученной модели постоим таблицу. Таблица 3.3.4 – Анализ модели, дополнительные вычисления

et

у̂ y-ŷ (y-ŷ)² 100

y 32,42571429 7,904285714 62,47773265 19,59902235

40,47142857 1,198571429 1,436573469 2,876341321

48,51714286 -8,287142857 68,67673673 20,59941053

56,56285714 -11,59285714 134,3943367 25,77909082

64,60857143 3,731428571 13,92355918 5,460094486

72,65428571 7,045714286 49,6420898 8,840293959

∑ 315,24 0 330,5510286 83,15425347

Определим коэффициент детерминации:

̂)2

∑(y−y 330,5510286

R2 = 1 − ̅)2

∑(y−y

=1− = 0,774119291.

1463,3876

Определим стандартную ошибку:

∑(y−ŷ)² 330,5510286

???????? = √ =√ ≈ 9,09053118

????−2 4

Определим значимость модели, используя критерий Фишера:

R2 ∙(n−2) 0,774119291∙4

F= = = 13,70846222

1−R2 1−0,774119291

При уровне значимости ???? =0,05 и степенях свободы ????1 = 1, ????2 = 6 − 2 = 4 табличное значение критерия составляет Fтабл =7,71. Так как ????факт < ????табл , то уравнение регрессии признается статистически не значимым.

Далее вычислим ошибку аппроксимации:

1 |y−y̅| 83,15425347

ε = ∙∑ ∙ 100% = ∙ 100% ≈13, 86%.

n y 6

Следовательно, расчетные значения отклоняются от фактических в среднем на 13,86%. Поскольку ошибка превышает 7%, это уравнение плохо описывает тенденцию национального обменного курса.

Задача 3.6

По статистическим данным Росстата (таблица 3.4.1) выполнить комплексный статистический анализ инвестиций в основной капитал.

Таблица 3.4.1 — Инвестиции в основной капитал, млн. руб. Номер студента Регионы 2012 2013 2014

Приволжский

федеральный

округ 2012877 2301298 2355973

1; 15 Республика

Башкортостан 233683 266396 285520

2; 16 Республика

Маpий Эл 31656 46178 48354

3; 17 Республика

Моpдовия 49825 53714 55292

4; 18 Республика

Татарстан 470751 525730 542781

5; 19 Удмуртская

Республика 64221 82678 89836

6; 20 Чувашская

Республика 65255 60122 56446

7; 21 Пермский край 162241 219494 185649

8; 22 Киpовская

область 50545 58655 56294

9; 23 Нижегородская

область 257454 280884 286619

10; 24 Оренбургская

область 151250 152877 150208

11; 25 Пензенская

область 72343 82164 83690

12;26 Самарская

область 213022 269737 300311

13; 27 Саратовская

область 117646 125834 132804

14; 28 Ульяновская

область 72985 76835 82168

Мы анализируем динамику инвестиций в Ульяновскую область по сравнению с общей динамикой инвестиций в Приволжский федеральный округ. Таблица 3.4.2 – Инвестиции в основной капитал, млн. руб. (вариант 14)

Регионы 2012 2013 2014 Приволжский 2012877 2301298 2355973 федеральный округ Ульяновская область 72985 76835 82168

Проанализируем данные показатели. Таблица 3.4.3 – Анализ показателей Приволжского федерального округа.

Приволжский Абсолютный прирост, млн. руб. Темп роста % Темп прироста %

федеральный

округ

(инвистиции Цепной Базисный Цепной Базисный Цепной Базисный Год млн.руб.) 2012 2012877 — — — — — 2013 2301298 288421 288421 114,33 114,33 14,33 14,33 2014 2355973 54675 343096 102,38 117,05 2,38 17,05

В 2013 году по сравнению с 2012 наблюдается прирост в 14,33% , затем в 2014 году по сравнению с 2013 прирост составил 2,38%. Общий прирост за весть период с 2012 по 2014 составил 17,05%. За базисный год брался 2012 Можно сделать вывод, что прирост уменьшается.

Проанализируем инвестиции в Ульяновской области. Таблица 3.4.4 – Анализ инвестиций в Ульяновской области Год Ульяновская Абсолютный прирост, Темп роста % Темп прироста % Доля от

область млн. руб. общих

Цепной Базисный Цепной Базисный Цепной Базисный инвестиций 2012 72985 — — — — — — 3,63% 2013 76835 3850 3850 105,28 105,28 5,28 5,28 3,34% 2014 82168 5333 9183 106,94 112,58 6,94 12,5 3,49%

По данным таблицы видно, что темп прироста инвестиций в Ульяновской области в 2013 году по сравнению с 2012 составил 5,28%, а в 2014 по сравнению с 2013 – 6, 94%. За весь период прирост составил 12,22 %. Доля от общих инвестиций в период с 2012 по 2013 год уменьшилась на 0, 29%. А в период с 2013 по 2014 год увеличилась на 0,15% (рисунок 1).

8.00%

7.00%

6.00%

5.00%

4.00% Доля

Темп прироста 3.00%

2.00%

1.00%

0.00%

2012 2013 2014

Рисунок 1 – Динамика инвестиций в основной капитал в

Ульяновской области

Далее определим средние величины и показатели вариации:

Рассчитаем средний объем инвестиций по формуле средней арифметической простой:

∑ yi

y̅ = = 77329,33 млн.руб.

n

Рассчитаем дисперсию по формуле:

∑(у???? −у̅)²

σ2y = =14176764,22

n

Среднее квадратическое отклонение равно:

σy = √σ2y = √14176764,22 =3765,204406 млн. руб.

Коэффициент вариации рассчитаем по формуле:

σy 3765,204406

V= ̅

∙ 100% = ∙ 100% =4,87%

y 77329,33

Среднегодовой объем инвестиций в основной капитал за период 2012 – 2014 гг. по Ульяновской области составил 77329,33 млн.руб. со среднеквадратическим отклонением 3765,204406 млн.руб.

Определим коэффициент корреляции между инвестициями и выбранным фактором ).

Таблица 3.5.1 – Расчет коэффициента корреляции Общие инвестиции Ульяновская

yi-y̅ хi-x̅ (хi-x̅)(yi-y̅) (yi-y̅)² (хi-x̅)² (Приволж. область фед. округ)

72985 -210505,6667 -4344,33333 914506784,6 44312635699 18873232,11 2012877

76835 77915,33333 -494,333333 -38516146,44 6070799168 244365,4444 2301298

82168 132590,3333 4838,66667 641560426,2 17580196493 23412695,11 2355973

231988 0 0 1517551064 67963631361 42530292,67 Σ 6670148 Среднее 77329,33333 2223382,67

∑(????−????̅ )(????−????̅) 1517551064

???????????? = = =0,893

√∑(????−????̅ )2 ∙∑(????−????̅)2 √42530292,67∙67963631361

Оценим значимость коэффициента корреляции:

Выдвигаем гипотезы:

  • H0: rxy = 0, нет линейной взаимосвязи между переменными;
  • H1: rxy ≠ 0, есть линейная взаимосвязь между переменными;

Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия (величина случайной ошибки)

????−2

????ф = ???????????? √ и по таблице критических точек распределения

1−???????????? 2

Стьюдент t для заданного уровня значимости α и числа степеней свободы k = n — 2 находит критическую точку tcrit двусторонней критической области. Если tнабл < tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| > tкрит — нулевую гипотезу отвергают.

????−2 1

????ф = ???????????? √ 2

= 0,893√ ≈ 1,98

1−???????????? 1−0,893²

По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=1 находим tкрит = 12,706.

|tнабл| < tкрит, значит, полученное значение коэффициента корреляции признается не значимым.

Построим регрессионную модель связи инвестиций со временем (годами) и проведем ее статистический анализ.

Таблица 3.5.2 – дополнительные расчеты для построения модели . t y t-t̅ y-y̅ (y-y̅)² (y-y̅)(t-t̅ ) (t-t̅ )² ŷ y-ŷ (y-ŷ)² et

100

y 1 72985 -1 -4344,33 4344,33 1 18873232,11 72737,83 247,1667 61091,36 0,338654

2 76835 0 -494,33 0 0 244365,44 77329,33 -494,333 244365,44 0,64337

3 82168 1 4838,67 4838,67 1 23412695,11 81920,83 247,1667 61091,36 0,300806

∑ 6 231988 0 0 9183 2 42530292,67 231988 0 366548,17 1,282831

Ср.зн. 77329,33

Рассчитаем коэффициенты уравнения регрессии:

∑(t−t̅)(y−y̅)

а1 = ∑(t−t̅)²

=68146,33

a0=77329,33– 2·68146,33= 4591,5

Таким образом, линейная модель : у̂ =4591,5t + 68146,33

Определим коэффициент детерминации:

̂)2

∑(y−y 366548,17

R2 = 1 − ̅)2

∑(y−y

=1− = 0,9914.

9183

Определим стандартную ошибку:

̂)2

∑(y−y 366548,17

σε = √ =√ =605,4322

n−2 1

Определим значимость модели используя критерий Фишера:

R2 ∙(n−2) 0,9914∙1

F= = =115,279.

1−R2 1−0,9914

Табличное значение критерия со степенями свободы k 1=1 и k2=1, Fтабл = 161,45. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим.

Вычислим ошибку аппроксимации:

1 |y−y̅| 1,282831

ε= ∙∑ ∙ 100% = ≈ 0,4276

n y 3

Следовательно, расчетные значения отклоняются от фактических в среднем на 0,4276 %. Поскольку ошибка составляет менее 7%, это уравнение можно использовать как регрессию.

Таким образом, была изучена зависимость инвестиций от времени (года).

На этапе спецификации была выбрана парная линейная регрессия. Оценены её параметры методом наименьших квадратов. Статистическая значимость уравнения проверена с помощью коэффициента детерминации и критерия Фишера.

Заключение

В ходе выполнении курсовой работы был рассмотрен теоретический аспект основных средних величин, показателей вариации, корреляционного и регрессионного анализа, а также были построены регрессионные модели и сделаны статистические выводы о различных объектах исследования. В данной курсовой работе были решены статистические задачи на средние величины и статистические показатели; на корреляционный и регрессионный анализ.

Статистика наука, которая занимается изучением приемов систематического наблюдения массовых явлений социальной жизни человека, составлением численных их описаний и научной обработкой этих описаний. Статистическая закономерность составляет предмет статистической науки. Она представляет одну из форм проявления всеобщей причинной связи между явлениями в природе и обществе.

Для изучения предмета статистики разработаны и применяются специфические приемы, которые в совокупности образуют методологию статистики, например метод группировок, массовых наблюдений, индексный метод и т.д. Понятие статистики можно определить как совокупность приемов, применяемых ею для познания своего предмета. Сама статистика также выступает методом познания и для других общественных наук. Статистические методы используются комплексно, что обусловлено сложностью процесса экономико-статистического исследования.

В ходе выполнения работы так же были рассмотрены основные вопросы статистики и решены задачи по рассмотренным темам. Для решения задач использовалась программа MS Excel для удобства и точности подсчета и построения графиков как наглядных примеров.

Таким образом, можно сделать вывод о том, что в современном обществе статистика стала одним из важнейших инструментов контроля и управления национальной экономикой. Развитие рыночных отношений в стране поставило перед статистикой новую задачу – реформирование общеметодологических и организационных основ статистической теории и практики.

Список использованных источников

[Электронный ресурс]//URL: https://management.econlib.ru/kursovaya/gde-vzyat-statisticheskie-dannyie-dlya-diplomnoy-rabotyi/

1. Балдин, К.В. Общая теория статистики: Учебное пособие / К.В. Балдин, А.В. Рукосуев. – М.: Дашков и К, 2012. 312 c.

2. Бычкова, С.Г. Социально-экономическая статистика: Учебник для бакалавров / С.Г. Бычкова. — М.: Юрайт, 2013. 591 c.

3. Гмурман, В.Е. Теория вероятностей и математическая статистика: Учебное пособие для бакалавров / В.Е. Гмурман. – М.: Юрайт, 2013.

4. Елисеева И. И., Юзбашев М. М. Общая теория статистики: Учебник. — М.: Финансы и статистика, 2002.

5. Ефимова, М.Р. Общая теория статистики: Учебник / М.Р. Ефимова, Е.В. Петрова, В.Н. Румянцев. — М.: ИНФРА-М, 2013. 416 c.

6. Кошевой О.С., Некрылова Н.В. Общая теория статистики: учебное пособие. – Пенза: Издательство ПГУ, 2017. 138 с.