Webbc.ru

Веб и кризис
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Анализ статистической информации

Анализ данных: используем методы статистического исследования

Анализ данных и статистика — вещи одного порядка. Если статистика первооснова и источник информации, то анализ данных — это инструмент для ее исследования, и зачастую анализ данных без статистики невозможен.

Статистика — это изучение любых явлений в числовой форме. Статистика используется анализом данных в количественных исследованиях. Противоположность им — качественные, описывающие ситуацию без применения цифр, в текстовом выражении.

Количественный анализ статистических данных проводится по интервальной шкале и по рациональной:

  • интервальная шкала указывает, насколько тот или иной показатель больше или меньше другого и дает возможность подобрать похожие по свойствам соотношения показатели,
  • рациональная шкала показывает, во сколько раз тот или иной показатель больше или меньше другого, но в ней содержатся только положительные значения, что не всегда будет отражать реальное положение дел.

Как используют Data Mining в компании Mail.ru?

Методы анализа статистических данных

В анализе статистических данных можно выделить аналитический этап и описательный. Описательный этап — последний, он включает представление собранных данных в удобном графическом виде – в графиках, диаграммах, дашбордах. Аналитический этап — это анализ, заключающийся в использовании одного из следующих методов:

  • статистического наблюдения – систематического сбора данных по интересующим характеристикам;
  • сводки данных, в которой можно обработать информацию после наблюдения; она описывает отдельные факты как часть общей совокупности или создает группировки, делит информацию по группам на основании каких-либо признаков;
  • определении абсолютной и относительной статистической величины; абсолютная величина придает данным количественные характеристики в индивидуальном порядке, в независимости от других данных; относительные величины описывают одни объекты или признаки относительно других;
  • метода выборки – использовании при анализе не всех данных, а только их части, отобранной по определенным правилам (выборка может быть случайной, стратифицированной, кластерной и квотной);
  • корреляционного и регрессионного анализа — выявляет взаимосвязи данных и причины, по которым данные зависят друг от друга, определяет силу этой зависимости;
  • метода динамических рядов — отслеживает силу, интенсивность и частоту изменений объектов и явлений; позволяет оценить данные во времени и дает возможность прогнозирования явлений.

Программное обеспечение для статистического исследования

Статистические исследования могут проводить маркетологи-аналитики:

Для качественного анализа статистических данных необходимо либо обладать знаниями математической статистики, либо использовать отчетно-аналитическую программу, либо не заниматься этим. Европейские компании давно осознали пользу big data для анализа больших данных, поэтому либо нанимают хороших аналитиков с математическим образованием, либо устанавливают профессиональное программное обеспечение для аналитиков-маркетологов. Ежедневный анализ в этих компаниях помогает им правильно организовывать закупку товаров, их хранение и логистику, корректировать количество персонала и их рабочие графики.

Решения для автоматизации анализа данных позволяют работать с ними аналитикам-маркетологам. Сегодня есть решения, доступные даже небольшим компаниям, такие как Tableau. Их преимущества по сравнению с анализом, проведенным исключительно человеком:

  • невысокая стоимость внедрения (от 2000 рублей в месяц – на февраль 2018 года),
  • современное графическое представление анализа,
  • возможность мгновенно переходить от одного, более полного отчета, к другому, более детальному.

Хотите узнать, как провести анализ и сделать отчеты быстро?

Методы обработки и анализа статистической информации;

Результаты группировки и сводки данных массовых статических наблюдений на третьей стадии статических исследований подвергаются дальнейшей обработке и осмыслению, т.е. на их базе исчисляются статистические показатели.

Сравнительные и связные рассмотрения статистических данных, исчисление статистических показателей, получение статистических фактов, их обобщение и осмысление в целях получения целостной картины состояния и развития изучаемого явления, выявления и качественной оценки закономерностей и факторов, определяющих это развитие, составляет содержание статистического анализа.

Основным условием, обеспечивающим правильность статического анализа и получаемых из этого выводов, является понимание сущности изучаемых массовых явлений и процессов. Отсюда вытекают основные принципы статистического анализа:

1) знание теории изучаемого явления, предварительное выявление сущности решаемой при статическом исследовании проблемы для правильного формулирования цели и задачи анализа;

2) знание особенностей той конкретной обстановки, места и времени, в которых развивается изучаемое явление, что позволяет уточнить выбор необходимых статистических показателей и методов их расчёта и анализа;

3) комплексный характер изучаемого явления — необходимо рассматривать всю совокупность относящихся к изучаемому явлению фактов и характеризовать явление с разных сторон, использовать различные статистические источники и определённые сочетания различных методов.

В настоящее время в статистике имеется большое количество методов, способов и приёмов анализа статистических данных. При этом понятия «метод», «способ» и «приём» как инструментарий анализа не имеют чёткого разграничения.

При статистическом изучении массового явления большое значение имеет объективное и всестороннее количественное выражение состояния развития в конкретных условиях пространства и времени, выявление и измерение внутренних и внешних закономерностей, в связи с чем рационально использовать следующую классификацию методов:

1) состояние статистической совокупности и её основных элементов характеризуется с применением абсолютных, относительных и средних величин и статистических коэффициентов;

2) изучение изменения (развития) явления во времени осуществляется с использованием статистических показателей рядов динамики, методов выявления и количественной оценки сезонных тенденции (тренда) развития, методов выявления и количественной оценки созданных колебаний, метода параллельных рядов и др.;

3) задачи выявления и измерения связей, взаимосвязей, закономерностей массовых явлений могут решаться с использованием рядов распределения, графического метода, метода аналитических группировок, метода параллельного сопоставления рядов, методов математической статистики.

В статистике иногда применяют и другие подходы к разграничению приёмов анализа. Например, условно их подразделяют на две группы: традиционные (статистические) и математические.

Основным приёмом анализа статистических данных является сравнение. Любой показатель уровня развития явления сам по себе оказывается недостаточным и должен быть рассмотрен в связи, в сравнении с другим аналогичным или взаимосвязанным показателем, который принимается за масштаб оценки (или, иначе, за базу сравнения).
Сравнительные сопоставления статистических данных позволяют раскрывать характерные особенности и закономерности изучаемых массовых явлений. Основными формами сравнения являются:

· сопоставление одноимённых явлений или показателей (по основным направлениям: с прошлым, с планом, со средними данными, с лучшим и так далее);

· сопоставление разноимённых показателей;

· динамическое сравнение содержания и особенностей отдельных форм и направлений.

Необходимым условием правильности выводов, получаемых на основе сравнения статистических данных, является соблюдение требования сопоставимости этих данных.

Расчёты отдельных статистических показателей используются тогда, когда имеющиеся статистические источники не дают непосредственно необходимых для осуществления соответствующего анализа статистической информации. Статистические расчёты, например, абсолютных величин применяются тогда, когда эти величины не могут быть получены на основе непосредственного подсчета (сводки) данных статистических наблюдений, или когда имеющиеся подсчёты не отвечают в той или иной мере задачам анализа.

В практике статистики наиболее широко применяются следующие три вида расчётов показателей, необходимых для анализа статистических данных:

  • приближённые расчеты на основе экстраполяции или интерполяции;
  • расчёты сложных (производных) показателей или итогов на основе объединения данных по составным частям сложных явлений;
  • балансовые расчёты.

При приближённых расчётах отсутствующих в сводках статистических величин исходной базой служат уже известные абсолютные и другие статистические величины, связанные с теми статистическими величинами, которые необходимы для осуществления соответствующего анализа.

При экстраполяции расчёт неизвестной величины производится с помощью заимствованных из других статистических источников или рассчитанных вспомогательных величин, которые связывают известную исходную величину с необходимой для анализа статистической величиной. При интерполяции расчёт необходимых для анализа величин основывается на особых предположениях о характере изменения интересующей исследователя величины в пределах исследуемой совокупности, внутри известных данных.

Основное назначение балансовых расчётов в статистике – сопоставление между собой и объединение в одной общей таблице данных о составных частях (элементах), из которых слагается общее изменение изучаемого явления.
Например, на основе баланса труда можно осуществить статистические расчёты неизвестных составных его частей и выполнить расчет «моментных» итогов.

Читать еще:  Методологические основы факторного анализа

При изучении любого массового явления важно выяснить, существует ли в действительности причинная связь между изучаемыми показателями и явлениями. В статистике принято различать следующие основные виды связей: балансовая, компонентная, факторная.

Балансовая связь применительно к экономическим явлениям характеризует зависимости между источниками формирования ресурсов (средств) и их использованием. Важное практическое значение количественного выражения балансовой зависимости состоит в том, что при отсутствии значения одного из составляющих элементов оно может быть определено на основе соответствующей формулы.

Компонентные связи характеризуются тем, что изменение обобщающего показателя определяется изменением компонентов (элементов), входящих в этот показатель, как множители: a=b*c, b=a/c, c=b/c. Компонентные связи широко используются в индексном методе для выявления роли отдельных факторов в совокупном изменении сложного показателя.

Факторные связи характеризуются тем, что проявляются в согласованной вариации изучаемых показателей. При этом одни показатели выступают как независимые (факторные), а другие – как результативные. По своему характеру такой вид связи является причинно-следственной зависимостью.

В свою очередь, факторные связи подразделяются на функциональные и корреляционные. При наличии функциональной связи изменению одного явления во всех случаях соответствует строго определённое изменение другого явления, находящегося с ним в причинной связи. Например, балансовые и компонентные связи относятся к функциональным. При корреляционной связи определённому изменению одного явления соответствуют различные по величине изменения другого явления. Например, один и тот же прирост уровня производительности труда у двух рабочих не обязательно сопровождается одинаковым увеличениям их заработанной платы. Следовательно, корреляционная связь не проявляется в каждом отдельном случае и её может быть выявлено только при исследовании массы случаев однородной совокупности.

В общем виде анализ статистических данных предполагает последовательное выполнение следующих основных этапов (ступеней) работ:

1) постановка вопроса и составление плана анализа;

2) подбор и критическая оценка источников статистических сведений, из которых берутся необходимые для анализа цифровые данные;

3) выборка необходимых данных из источников, их доработка и систематизация;

4) осуществление необходимых расчётов и обработка данных при помощи специальных приёмов, осмысление результатов;

5) формулировка выводов и практических предложений.

Наиболее ответственной (а также трудоёмкой) при проведении развёрнутого анализа работой является отбор источников информации и выборка из них необходимых данных. Эта работа должна сопровождаться критической оценкой статистических источников информации. При наличии нескольких источников по одному и тому же вопросу данные разных источников сопоставляются друг с другом, выясняются причины имеющихся расхождений и выбирается источник, заслуживающий наибольшего доверия. По отобранным источникам выполняется арифметический и логический контроль данных. Для исключения несопоставимости по исчислению и методам расчётов необходимо брать данные из последних по времени статистических наблюдений.

АНАЛИЗ СТАТИСТИЧЕСКОЙ ИНФОРМАЦИИ

Анализ статистической информации представляет собой социально-экономическое исследование. Основной задачей статистического анализа данных о работе ЖД транспорта в условиях его реформирования является установление закономерностей развития этой важной отрасли экономики в целом и отдельных видов ее деятельности.

В процессе такого анализа большое значение имеет оценка влияния условий и качества работы на динамику показателей эффективности различных видов деятельности и выявление резервов ее повышения. Оценка текущих резервов является важнейшей задачей, решение которой позволяет обеспечить повышение эффективности использования основных средств, рабочей силы и производственных запасов. В связи с этим в данном разделе учебника особое внимание уделено методологическим основам анализа статистической информации и практическому применению их в процессе анализа использования активной части основных средств ЖД транспорта — локомотивов и вагонов, а также раскрывается порядок оценки текущих резервов улучшения их использования по времени и мощности

Исходным принципом статистического анализа является требование производить его на основе всей совокупности фактов, относящихся к рассматриваемому явлению. необходимо убедиться в достоверности данных источников,. Необходимо учитывать и особенности тех показателей, значения которых используются для решения конкретных задач.

Исходной базой установления многих фактов служат данные, полученные в результате сводки первичной статистической информации в виде абсолютных суммарных величин, Эти данные позволяют охарактеризовать уровень анализируемого явления.

Методы статистического анализа

При анализе экономических и социальных явлений на базе данных статистики используются, прежде всего, традиционные статистические методы: группировка, сравнение, приведение параллельных рядов и др. Вместе с тем применяются также математические методы, в частности регрессионно-корреляционный, факторный анализ и др. Одним из наиболее действенных методов анализа являются группировки, при помощи которых изучаемое явление делится на части, характеризуемые рядом показателей. Это позволяет выявить структуру изучаемого явления и взаимодействие между частями и показателями в пространстве и во времени.

Действенным методом статистического анализа являются сравнения, дающие возможность оценить ход выполнения плановых заданий и соблюдение установленных нормативов, вскрыть резервы, установить сходство и различие изучаемых явлений, охарактеризовать их специфические особенности.

Элементарным и вместе с тем действенным способом сравнений является приведение параллельных данных, например сопоставление результатов производственной деятельности двух предприятий, находящихся примерно в одинаковых условиях хозяйствования.

При проведении сопоставлений статистических данных необходимо строго соблюдать правило: сравниваемые данные должны быть сопоставимы. Несоблюдение этого правила приводит к ложным выводам и заключениям. из-за различия в периодах,

Неоднородные данные во многих случаях могут быть приведены к сопоставимому виду путем их пересчета. Неоднородность данных вследствие различия единиц учета может быть устранена пересчетом данных в одних и тех же единицах.

Аналитич возмож сист показателей ЖД статистики

Система показателей ЖД статистики объединяет ряд подсистем, относящихся к отдельным отраслям и сферам деятельности ЖД транспорта, связь между которыми обусловлена единством цели функционирования всех отраслей ЖД хозяйства, направленной на осуществление перевозок. Аналитические возможности системы определяются полнотой набора показателей и степенью детализации статистической информации во временном и территориальном разрезах. Поэтому анализу работы дороги предшествует классификация показателей ее деятельности по ряду признаков: экономической природе, степени обобщенности, содержанию, причинно-следственной связи и степени зависимости от усилий коллектива работников дороги.

По экономической природе различают показатели результата и затрат (такое деление применимо только к объемным показателям). К показателям результата относятся грузооборот (тарифный), пас-сажирооборот и доходы. Все остальные показатели прямо или косвенно отражают затраты производства. работы подвижного состава, абсолютный расход материалов и энергетических ресурсов, численность работников, фонд оплаты труда и т.д.

за счет экономии затрат.

В зависимости от степени обобщения качественные показатели подразделяются на синтетические (общие) и аналитические (частные). Показатели которые стоят в основании системы, поскольку они несут наиболее важную для выводов и обобщений информацию: о выполнении нормативов производственных процессов в отдельных звеньях, достижениях и недостатках, браке в работе. Их можно назвать первичными факторами.

В зависимости от формы причинно-следственной связи показатели можно разделить на результативные и факторные. Сущность показателя с этой точки зрения устанавливается в каждом конкретном случае отдельно, поскольку один и тот же показатель в разных условиях может выступать в различном качестве.

Особое значение для анализа имеет деление показателей по степени зависимости их уровня от усилий работников данного подразделения. две группы — показатели условий работы и показатели качества работы. Без такого разграничения невозможно оценить успешность производственной деятельности, выявить достижения и недостатки в работе, изыскать внутренние резервы повышения эффективности производства, что, по существу, является конечной целью анализа.

Успешность работы характеризуется главным образом каче-; ственными показателями, поскольку именно от них зависят результаты работы и затраты при сложившихся условиях. Это показатели средней продолжительности технологических операций: средний к простой вагона под одной грузовой операцией и на одной станции

Читать еще:  Основные виды проектного анализа

одна из главных задач анализа заключается в выявлении внутренних резервов повышения эффективности производства и их подсчете. Выявить резервы — это значит выделить те первичные факторы, зависящие от усилий коллектива, т.е. показатели качества, уровень которых под влиянием отдельных упущений и недостатков в работе был ниже оптимального. Подсчитать размер резервов — значит определить, каким был бы уровень результативного показателя в фактических условиях работы при оптимальном уровне показателей качества (потенциально возможный уровень). За оптимальный уровень могут быть приняты технические нормы, уровень показателя по технологическому процессу или плану, а также уровень показателя в базисном периоде, если он объективно достижим. Следовательно, подсчету резервов предшествует всесторонний анализ выполнения плана и динамики работы железных дорог.

1. Значение, задачи и цели статистики железнодорожного транспорта.
2. Организация статистики на железнодорожном транспорте.
3. Функции органов статистики на железнодорожном транспорте.
4. Основные разделы железнодорожной статистики.
5. Статистика перевозок. Значение, задачи, содержание.
6. Система первичного учета и отчетности в статистике перевозок.
7. Организация статистического наблюдения перевозок грузов. Первоисточники учета.
8. Объемные показатели статистики перевозок грузов.
9. Группировки в статистике перевозок грузов.
10. Качественные показатели статистики перевозок грузов. Методика расчета.
11. Организация статистического наблюдения перевозок пассажиров. Первоисточники учета.
12. Объемные показатели перевозок пассажиров и виды группировок.
13. Качественные показатели перевозок пассажиров. Методика расчета.
14. Система показателей перевозок грузов во взаимосвязи и взаимозависимости.
15. Система показателей перевозок пассажиров во взаимосвязи и взаимозависимости.
16. Эксплуатационная статистика. Предмет, задачи и содержание.
17. Организация статистического наблюдения за работой подвижного состава. Единицы наблюдения измерения. Учетные признаки.
18. Специфика учета наличия подвижного состава. Понятие о инвентарном и наличном учете.
19. Инвентарный парк локомотивов. Группировка по категориям использования.
20. Инвентарный и наличный парк грузовых вагонов. Формы статистического наблюдения.
21. Группировка наличного парка грузовых вагонов по категориям использования.
22. Ежегодная перепись грузовых вагонов по сети железных дорог.
23. Наличный и инвентарный парк пассажирских вагонов.
24. Статистика технического состояния и ремонта подвижного состава.
25. Объемные и качественные показатели работы подвижного состава. Группировки.
26. Система показателей использования локомотивов взаимосвязь показателей использования локомотивов и вагонов.
27. Система показателей использования вагонов.
28. Статистика основных фондов и технической вооруженности.
29. Организация статистического наблюдения и первоисточники учета основных фондов.
30. Классификация основных фондов железных дорог.
31. Виды стоимостной оценки основных производственных фондов.
32. Показатели движения и использования основных фондов.
33. Статистика капитальных вложений и капитального строительства.
34. Статистика труда. Задачи и содержание.
35. Статистика численности. Первоисточники учета, группировки.
36. Статистика использования рабочего времени и трудовой дисциплины.
37. Основные показатели статистики численности. Методика расчета среднесписочной численности.
38. Показатели движения и текучести рабочей силы.
39. Статистика производительности труда.
40. Статистика заработной платы.
41. Статистика материально-технического снабжения. Предмет, задачи, основные показатели.
42. Материальные балансы. Цели составления. Виды материальных балансов. Схема построения.
43. Статистика поставок и заготовок материальных ресурсов. Единица наблюдения, первоисточники учета, основные показатели.
44. Статистика наличия и движения материальных ресурсов. Первоисточники учета. Объемные и качественные показатели запаса и расхода материалов.
45. Финансовая статистика. Предмет, задачи, основные показатели.
46. Статистика доходов железных дорог. Первоисточники учета доходных поступлений.
47. Анализ статистической информации. Задачи и основные этапы.
48. Основные приемы анализа статистической информации.
49. Аналитические возможности системы показателей железнодорожной статистики.
50. Особенности организации железнодорожной статистики.
51. Статистика расходов железных дорог.

Дата добавления: 2018-05-12 ; просмотров: 403 ;

Анализ статистической информации

Проведение ранжирования исходных данных по величине активов, их группировка. Определение средней себестоимости изделия за определенный период, среднего линейного и квадратического отклонения, коэффициента вариации. Анализ данных о производстве продукции.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

По данным Приложения по своему варианту выполните следующую обработку статистического материала:

1. Проведите ранжирование исходных данных по величине активов и их группировку, образовав 5 групп с равновеликими интервалами группировки. Произведите расчет группировки по формуле.

2. Определите по каждой группе:

— величину кредитов — всего и в среднем на один банк;

— величину активов — всего и в среднем на один банк

Результаты представьте в табличном виде, проанализируйте их и сделайте выводы.

Активы коммерческого банка, млрд руб.

Кредиты коммерческих банков, млрд руб.

Определим размер интервала:

где h — значение интервала;

R — размах вариации, т.е. разница между максимальным (xmax) и минимальным (xmin) значениями признака в совокупности,;

h = 13,8 — 3,8 / 5 = 2

Определим границы каждой группы:

1 группа: [3,8 — 5,8[

2 группа: [5,8 — 7,8[

3 группа: [7,8 — 9,8 [

4 группа: [9,8 — 11,8[

5 группа: [11,8 — 13,8]

Таблица 1. Рабочая таблица по группировке банков по величине активов, млрд руб

Группы банков по величине активов, млрд руб.

Активы коммерческого банка, млрд руб.

Кредиты коммерческих банков, млрд руб.

Итого по 1 группе:

Итого по 2 группе:

Итого по 3 группе:

Итого по 4 группе:

Итого по 5 группе:

Таблица 2. Группировка банков по величине активов, млрд руб

Группы банков по величине активов, млрд руб.

Активы коммерческого банка, млрд руб.

Кредиты коммерческих банков, млрд руб.

в среднем на один банк

в среднем на один банк

Вывод: с увеличением активов коммерческого банка происходит рост кредитов коммерческого банка, следовательно, между изучаемыми признаками существует прямая зависимость. Большинство банков в совокупности находятся в 3 и 4 группах. В 5 группе предприятия имеют наибольшую стоимость активов банков, а кредиты банка ниже, чем в 4 группе.

Пот трем заводам, выпускающим изделие «А», имеются следующие данные о себестоимости продукции:

Себестоимость единицы изделия, тыс. руб.

Издержки производства, млн руб.

Себестоимость одного изделия, тыс. руб.

1. Рассчитайте среднюю себестоимость изделия А за базисный и отчетный годы; ранжирование актив себестоимость отклонение вариация

2. Определите, за какой год и на сколько средняя себестоимость изделия была снижена (в абсолютных и относительных величинах)

Укажите, какие формулы средних заданных показателей применялись для расчета

1) среднюю себестоимость изделия А за базисный год вычислим по средней гармонической взвешенной:

Когда статистическая информация не содержит частот f по отдельным варианта совокупности х, а представлена как их произведение хf, применяется формула средней гармонической взвешенной. Среднюю урожайность зерновых культур в отчетном периоде вычислим по средней арифметической взвешенной

Средняя арифметическая применяется в тех случаях, когда известны варианты варьирующего признака х и их частоты f.

За год себестоимость изделия А снизилась на:

26,4 — 29,6 = -3,2 тыс. руб.

В относительной величине:

26,4/29,6*100 — 100 = -10,8%

Имеется распределение предприятий по объему работ за год

Объем работ, млн руб.

Количество предприятий, % к итогу

1. Среднее линейное отклонение

2. Среднее квадратическое отклонение

3. Коэффициент вариации

Объем работ, млн руб.

1) определим средний объем предприятий за год

Среднее линейное отклонение определим по формуле:

2) определим выборочную дисперсию:

Среднее квадратическое отклонение:

3) коэффициент вариации

4) мода — значение случайной величины, встречающееся с наибольшей вероятностью в дискретном вариационном ряду — вариант, имеющий наибольшую частоту.

уМ0 — нижняя граница модального интервала;

iМ0 — величина модального интервала;

fМ0 — частота модального интервала;

fМ0-1 — частота интервала, расположенного перед модальным;

fМ0+1 — частота интервала, следующего за модальным.

5) медиана — это вариант, который находится в середину вариационного ряда. Медиана делит ряд на две равные (по числу единиц) части — со значениями признака меньше медианы и со значениями признака больше медианы.

уМе — нижняя граница медианного интервала;

iМе — величина медианного интервала;

SМе-1 — накопленная частота интервала, расположенного перед медианным;

FМе — частота медианного интервала

Средний объем работ по всем предприятиям составил 127,2 млн руб., поскольку коэффициент вариации менее 33%, это говорит о том, что данная совокупность предприятий однородна по объему работ. В данной совокупности преобладают предприятий с объемом работ 125 млн руб., половина предприятий имеет объем работ менее 126,7 млн руб., другая — более.

По данным Приложения определить:

1. С вероятностью до 0,997 предельную ошибку выборочной средней и границы, в которых будет находиться сумма активов всех банков генеральной совокупности

2. С вероятностью 0,954 предельную ошибку выборки при определении доли и границы, в которых будет находиться удельный вес банков с активами выше модального интервала, если известно, что 20 банков составляют 10% обследованных банков по величине активов

1. Определим среднюю ошибку выборки при бесповторном отборе:

где n — объем выборки (число обследованных единиц)

N — объем генеральной совокупности

N = 20*100 :10 = 200 ед.

Определим дисперсию по формуле:

Найдем предельную ошибку выборки, учитывая, что при заданной вероятности 0,997 коэффициент доверия = 3

Следовательно, сумма активов всех банков генеральной совокупности с вероятностью 0,997 находится в доверительном интервале

(8,82 — 1,53) х (8,82 + 1,53)

2. Мода — значение случайной величины, встречающееся с наибольшей вероятностью в дискретном вариационном ряду — вариант, имеющий наибольшую частоту. Таким образом, в нашем случае, модальным является интервал от 7,8 до 11,8, количество банков в этом интервале равно 12.

Определим выборочную долю:

где т — число единиц, обладающих изучаемым признаком

Определим среднюю ошибку выборки при бесповторном отборе для долей:

Определим предельную ошибку доли по формуле бесповторного отбора, учитывая, что при заданной вероятности 0,954 коэффициент доверия = 2:

Следовательно, с вероятностью 0,954 можно утверждать, что удельный вес банков с величиной активов от 7,8 до 11,8 млрд руб. колеблется в доверительном интервале:

0,6 — 0,208 р 0,6 + 0,208

0,392 р 0,808 или 39,2 % р 80,8 %

Выпуск телевизоров предприятием характеризуется следующими данными

Полезные статьи → Статистические методы анализа данных в решении практических задач (часть первая)

Опрос сотрудников, клиентов, потребителей, – это не просто сбор информации, а полноценное исследование. А целью всякого исследования является научно обоснованная интерпретация изученных фактов. Первичный материал необходимо обработать, а именно упорядочить и проанализировать. После опроса респондентов происходит анализ данных исследования. Это ключевой этап. Он представляет собой совокупность приемов и методов, направленных на то, чтобы проверить, насколько были верны предположения и гипотезы, а также ответить на заданные вопросы. Данный этап является, пожалуй, наиболее сложным с точки зрения интеллектуальных усилий и профессиональной квалификации, однако позволяет получить максимум полезной информации из собранных данных. Методы анализа данных многообразны. Выбор конкретного метода зависит, в первую очередь, от того, на какие вопросы мы хотим получить ответ. Можно выделить два класса процедур анализа:

  • одномерные (дескриптивные) и
  • многомерные.

Целью одномерного анализа является описание одной характеристики выборки в определенный момент времени. Рассмотрим более подробно.

Одномерные типы анализа данных

Количественные исследования

Дескриптивный анализ

Дескриптивные (или описательные) статистики являются базовым и наиболее общим методом анализа данных. Представьте, что вы проводите опрос с целью составления портрета потребителя товара. Респонденты указывают свой пол, возраст, семейное и профессиональное положение, потребительские предпочтения и т.д., а описательные статистики позволяют получить информацию, на основе которой будет строиться весь портрет. В дополнение к числовым характеристикам создаются разнообразные графики, помогающие визуально представить результаты опроса. Всё это многообразие вторичных данных объединяется понятием «дескриптивный анализ». Полученные в ходе исследования числовые данные наиболее часто представляются в итоговых отчетах в виде частотных таблиц. В таблицах могут быть представлены разные виды частот. Давайте рассмотрим на примере: Потенциальный спрос на товар

  1. Абсолютная частота показывает, сколько раз тот или иной ответ повторяется в выборке. Например, 23 человека купили бы предложенный товар стоимостью 5000 руб., 41 человек – стоимостью 4500 руб. и 56 человек – 4399 руб.
  2. Относительная частота показывает, какую долю данное значение составляет от всего объема выборки (23 человека – 19,2%, 41 – 34,2%, 56 – 46,6%).
  3. Кумулятивная или накопленная частота показывает долю элементов выборки, не превышающих определенное значение. Например, изменение процента респондентов, готовых приобрести тот или иной товар при уменьшении цены на него (19,2% респондентов готовы купить товар за 5000 руб., 53,4% — от 4500 до 5000 руб., и 100% — от 4399 до 5000 руб. ).

Наряду с частотами, дескриптивный анализ предполагает расчет различных описательных статистик. Соответствуя своему названию, они предоставляют основную информацию о полученных данных. Уточним, использование конкретной статистики зависит от того, в каких шкалах представлена исходная информация. Номинальная шкала используется для фиксации объектов, не имеющих ранжированного порядка (пол, место жительства, предпочитаемая марка и т.д.). Для подобного рода массива данных нельзя рассчитать каких-либо значимых статистических показателей, кроме моды — наиболее часто встречающегося значения переменной. Несколько лучше в плане анализа ситуация обстоит с порядковой шкалой. Здесь становится возможным, наряду с модой, расчет медианы – значения, разбивающего выборку на две равные части. Например, при наличии нескольких ценовых интервалов на товар (500-700 руб. руб., 700-900, 900-1100 руб.) медиана позволяет установить точную стоимость, дороже или дешевле которой потребители готовы приобретать или, наоборот, отказаться от покупки. Наиболее богатыми на все возможные статистики являются количественные шкалы, которые представляют собой ряды числовых значений, имеющих равные интервалы между собой и поддающихся измерению. Примерами подобных шкал могут служить уровень дохода, возраст, время, отводимое на покупки и т.д. В данном случае становятся доступными следующие информационные меры: среднее, размах, стандартное отклонение, стандартная ошибка среднего. Конечно, язык цифр является довольно «сухим» и для многих весьма непонятным. По этой причине дескриптивный анализ дополняется визуализацией данных путем построения различных диаграмм и графиков, как, например: гистограммы, линейные, круговые или точечные диаграммы.

Таблицы сопряженности и корреляции

Таблицы сопряженности – это средство представления распределения двух переменных, предназначенное для исследования связи между ними. Таблицы сопряженности можно рассматривать как частный тип дескриптивного анализа. В них также является возможным представление информации в виде абсолютных и относительных частот, графическая визуализация в виде гистограмм или точечных диаграмм. Наиболее эффективно таблицы сопряженности проявляют себя в определении наличия взаимосвязи между номинальными переменными (например, между полом и фактом потребления какого-либо продукта). В общем виде таблица сопряженности выглядит так. Зависимость между полом и пользованием страховыми услугами

Статистический анализ данных

На основе представленных в таблице данных и можно делать выводы о наличии/отсутствии взаимосвязи между исследуемыми переменными. Для более точного выявления наличия связи между переменными используют разные статистические критерии. Наиболее часто применяются такие, как:

  • критерий Хи-квадрат (χ2);
  • коэффициент сопряженности;
  • критерий лямбда;
  • коэффициент R Спирмена;
  • критерий корреляции Пирсона и др.

Правильный выбор критерия является решающим шагом для получения корректных результатов. Поэтому, если перед вами стоит задача проведения статистического анализа и интерпретация его результатов, но вы не чувствуете уверенности – лучше обратиться к специалистам сервиса Анкетолог, чтобы не получить неправильные выводы, не приближающие к решению проблемы.

По вопросам расчета индексов:

Телефон: +7 (383) 203-49-99

Продолжение статьи «Статистические методы анализа данных для решения практических задач»: часть вторая и часть третья.

Ссылка на основную публикацию
Adblock
detector