И еще раз о шкалах

Самое первое в статистике – это измерение или подсчет.
В теории измерения говорится, в частности, о связи между данными и реальностью.
Набор данных это модель реальности выраженная в числах. Данные бывают номинальные, порядковые, интервальные и отношений. Они могут быть непрерывными или дискретными.

Поскольку статистика стремится точно приблизиться в отношении связи между данными и реальностью, она предпочитает интервальную шкалу (шкалу разностей) или шкалу отношений (абсолютную шкалу).
http://home.ubalt.edu/ntsbarsh/stat-data/topics.htm#rrtopic
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

О пользе графиков





















_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Еще одна работа done

Работа по оценке влияния психофизиологических особенностей мышления учащихся на результаты обучения закончена.
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Из области доказательной науки

"Отсутствие телеграфных столбов при археологических раскопках древней эллады позволяет сделать выводы, что древние греки владели беспроводной радиосвязью"
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Праздничное (до начала тотального празднования)

В конце года принято подводить итоги, поздравлять родных и близких с новогодними праздниками, строить планы на будущее. Вот и мы решили не отставать.
Аналитическая группа «6 сигма» в уходящем году провела 36 статистических анализов: от оценки данных для дипломных проектов и статей, до работ над данными кандидатских диссертаций.

Мы особенно радуемся тому, что наши заказчики все большее внимание уделяют планированию исследования, потому как правильно спланированное исследование дает хорошие результаты на этапе статистической обработки результатов.

Огромное спасибо вам, нашим заказчикам, за то что вы сделали свой выбор в нашу пользу, мы рады что смогли помочь вам решить ваши задачи и мы надеемся, что вы обратитесь к нам снова и будете рекомендовать нас своим коллегам. Поздравляем вас с наступающим Новым годом и Рождеством, желаем вам новых смелых планов и их успешного исполнения, желаем вам здоровья и успехов.
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Юмор

Строим кривые из подручных материалов ;)

http://mathcraft.wonderhowto.com/blog/create-parabolic-curves-using-straight-lines-0131301/

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Черное и белое


"Нынешняя научная действительность такова, что исследователи вынуждены поворачивать свои работы так, чтобы рассказать классную историю, а не представить то, что они в действительности обнаружили. Как будто бы все сидят на стероидах и для того, чтобы быть конкурентоспособным, ты должен употреблять их еще и еще”.
Jonathan Schooler
Полезнейшая статейка про фальсификацию данных в современной науке!!!!! http://www.lenta.ru/articles/2011/11/12/scandals/

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Статистика и жизнь

Человеку, имеющему хотя бы общее представление о статистике и обладающему здравым смыслом, достаточно посмотреть на график, чтобы понять: на выборах этого года в Москве имела место массовая беззастенчивая фальсификация (более чем на двух третях участков), а на некоторых участках фальсификация была чудовищной. При этом официальные лица, глазом не моргнув, заявляют, что выборы были честными, а все сомнения в этом – на руку врагам.

Конечно, эти самые официальные лица понимают, что им не верят не только образованные люди, но и огромное число простых людей. Им хорошо бы получить поддержку титулованных ученых – чтобы было чем заткнуть всяких там математиков, биологов и физиков, по роду деятельности хорошо знающих статистику и измывающихся над ЦИК. Видимо, именно за этим Владимир Чуров обратился в Президиум РАН, выступив там с докладом «Избирательный процесс: теория, практика и научное сотрудничество».....

Детализацию смотрите здесь >>>
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Проблемы стат.анализа в психологии

"В качестве решения проблем статистического анализа в психологических исследованиях можно предложить следующее.
  • Использовать «необходимо достаточные» выборки (минимум 30, желательно от 50, оптимально около 100 человек). 
  • Применять проверенные методы статистической обработки (они достаточно мощные, чтобы выявить закономерности), а не идти от «слабых» к «сильным»; лучше выявить «лишнюю» связь, чем ее пропустить.
  • Если полученную закономерность не удается интерпретировать, стоит проверить ее на воспроизводимость. 
  • Интерпретировать только то, что интерпретируется, и при этом можно обратиться к мало используемой в последнее время процедуре — экспертной оценке; попросту говоря, спросить у специалиста, похоже ли это на реальность и что результат может означать".

Хвостов А.А. Проблемы статистического анализа в психологических исследованиях //Развитие личности, 2003.-№2.-С.111-119.
 _______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Принцип Фишера

"Отклонения от нормального вида, если только они не слишком заметны, можно обнаружить лишь для больших выборок, однако сами по себе эти отклонения вносят малое отличие в статистические критерии и другие вопросы"

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Визуализация

Как сказано в известной книге Джона Чемберса и соавт. (Chambers J.M. et al. (1983) Graphical Methods for Data Analysis), "...нет статистического метода более мощного, чем хорошо подобранный график".
Действительно, графическое представление данных играет очень важную роль в статистике. Например, графики являются неотъемлемой частью разведочного анализа данных, позволяют выявлять паттерны и тренды в сложных наборах данных, а также могут непосредственно быть результатом статистического анализа

R: Анализ и визуализация данных: Базовые графические возможности R: функция plot()

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Полезное

Во всех смыслах полезный сайт для психологов, и не только http://www.psychol-ok.ru/
Есть описание нескольких наиболее часто используемых стат.критериев в психологии и скрипты их расчета.
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Трудности

О том что применять статистические методы в исследованиях нужно, уже не сомневаются ни педагоги, ни психологи. Ранее это осознание пришло к биологам и другим "естественникам" (о физике и химии мы здесь даже не говорим, это априори понятно).
Но вот что по-настоящему удивляет, так это то, что авторы работ, раскрывающие особенности тех или иных статистических критериев "не опускаются" до уровня читателей. Возмущению нет предела! Попалась недавно в руки работа Новикова А.М. "Как работать над диссертацией: Пособие для начинающего педагога исследователя. – 3-е изд. – М.: Издательство "Эгвес", 1999. – 104 с", где читаем:
"......нередко аспиранты, соискатели заимствуют друг у друга используемые статистические критерии достоверности различий, не ориентируясь, какой критерий можно и нужно использовать в том или ином случае. В оправдание этому следует сказать, что в большинстве пособий по математической статистике соответствующие разделы написаны настолько нечетко и сложно, что разобраться в них непрофессиональному статистику довольно-таки трудно. Поэтому мы здесь приведем следующий «рецепт»....".
Совершенно согласен с автором, что есть ряд работ наших современников, которые ориентированы явно на специалистов, НО...
Очевидно и то, что нежелание разобраться в сложных хитросплетениях применения статистических критериев заставляет исследователей искать простые пути, которые часто состоят в том, что используются старые-проверенные временем методы коллег (по-аналогии). К тому же, на полках магазинов легко найти книги по статистике дающие легкие рецепты достижения цели, эдакие простые алгоритмы. Собственно, автор рассматриваемой книги далее этим путем и идет:
"1. Если использована шкала отношений или интервалов, если применяются точно и объективно измеряемые оценки, то для проверки статистической достоверности дифференциации (разности) двух средних показателей (среднее значение по одной и по другой группе) применяются t-критерий Стьюдента или F-критерий Фишера. При этом необходимо убедиться в том, что распределение близко к нормальному (распределению Гаусса). В этом можно убедиться, сопоставив значения среднего, моды и медианы. Если среднее, мода и медиана приблизительно совпадают, то распределение можно считать нормальным и можно применять t или F критерии.
2. Если при использовании шкалы отношений данные выборок распределены не по нормальному, а какому-либо иному закону распределения, или в тех случаях, когда нет уверенности в распределении данных по нормальному закону, применяется менее чувствительный метод (хи-квадрат метод).
3. Если была использована шкала порядка, то, строго говоря, могут быть использованы только непараметрические критерии: критерий знаков, критерий Уилкоксона—Мана—Унтни, Колмогорова—Смирнова и другие. Но по сравнению с F, t - критериями, методом эти критерии очень малочувствительны, для установления достоверности различий по ним необходимы большие объемы выборок.
Соответствующие формулы и таблицы для оценки достоверности различий достаточно просты. Они приводятся во всех пособиях по математической статистике. Там же, также достаточно просто сформулированы правила, формулы вычисления среднего, моды и медианы распределения, дисперсии, о нем говорилось выше."
И совершенно шедевральное: "Более того, сейчас широко распространены компьютерные программы — «статистика» и др., которые выполняют эти вычисления автоматически — в них надо лишь подбавить имеющиеся экспериментальные данные".
Ну вот видите, как все просто! Достаточно внести цифры в программу - и всё.
Действительно, ВСЁ!

Головоломки

... В своей известной статье «Professor Tinbergen’s Method» Кейнс пишет, что Тинберген «предпочитает лабиринты арифметики лабиринтам логики». Он говорит, что эконометрический анализ становится похож на «детские головоломки, в которых вам нужно написать ваш возраст, умножить на что-то, прибавить еще что-то, вычесть и в конце концов получить число зверя из Откровения св. Иоанна Богослова»[21].

Эконометрика — Википедия

Теорема Байеса

Теорема Байеса имеет дело с расчетом вероятности верности гипотезы в условиях, когда на основе наблюдений известна лишь некоторая частичная информация о событиях. Другими словами, по формуле Байеса можно более точно пересчитывать вероятность, беря в учет как ранее известную информацию, так и данные новых наблюдений. Главная, видимо, особенность теоремы Байеса в том, что для ее практического применения обычно требуется огромное количество вычислений-пересчетов, а потому расцвет методов байесовых оценок пришелся аккурат на революцию в компьютерных и сетевых инфотехнологиях.

Пример, из 20 студентов, пришедших на экзамен, 8 подготовлены отлично, 6 - хорошо, 4 - посредственно и 2 - плохо.
В экзаменнационных билетах всего 40 вопросов.
Студент подготовленный отлично, знает все вопросы, хорошо - 35, посредственно - 25 и плохо - 10 вопросов.
Некий студент ответил на все билеты.
Какова вероятность того, что он подготовлен плохо?

Гипотезы прихода на экзамен отличника (8/20), хорошиста (6/20), троечника (4/20), двоечника (2/20).
Есть вероятность того, что среди вопросов билета студент выпадет знакомый (40/40, 35/40, 25/40, 10/40 соответсвенно).
Вероятность что хорошо ответил отличник Ротл=(8/20)*1=2/5; хорошист - Рхор=(6/20)*(35/40)=21/80; троечник - Ртро=(4/20)*(25/40)=1/8; и, наконец, двоечник - Рдво=(2/20)*(10/40)=1/40.
Применяя теорему Байеса, вычисляем вероятность того, что ответивший студент был двоечником
Р[сдал/двоечник]=Рдво/(Рдво+Ртро+Рхор+Ротл)=(1/40)/(1/40+1/8+21/80+2/5)=2/65
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Совет №5

Эксперимент чаще всего должен иметь контроль

Эксперимент всегда связан с проведением измерений повторностей (наименьшая часть изучаемого материала, которая может быть подвергнута воздействию изучаемого фактора независимо от воздействия на другие повторности). Контроль необходим для сравнения и определения влияния или невлияния изучаемого фактора (-ов).
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

10 простых правил по формированию и сохранению научной репутации

Rule 1: Think Before You Act : Правило 1: Подумайте, прежде чем делать
Rule 10: Never Plagiarize or Doctor Your Data : Правило 10: Никогда не занимайтесь плагиатом или исправлением данных

Bourne P.E., Barbour V. (2011) Ten Simple Rules for Building and Maintaining a Scientific Reputation. PLoS Comput Biol 7(6): e1002108. doi:10.1371/journal.pcbi.1002108

_______________
© 6 сигма - статистический анализ экспериментальных данных ______________________________________________________________

Кухня

Из чего складывается стоимость:
1. Из всего многообразия существующих статистических критериев не существует идеального, подходящего под все исследовательские задачи, поэтому, при обработке данных важно правильно группировать данные, определить статистический критерий, с учетом всех ограничений, которые накладывают на нас уже собранные данные.
2. Кроме того, при выборе критериев часто необходимо проверить, например, гипотезу о нормальности распределения.
3. Как правило приходится использовать не один критерий, а несколько.
4. Проведение анализа выбранными ранее критериями не выглядит как простой перенос данных, например, в программу STATISTICA и расчет одной кнопкой.
5. Много времени занимает интерпретация данных, потому что не всегда цифры говорят сами за себя. Объяснение полученых или неполученых различий это серьезная аналитическая работа.
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Отзывы

Что-то ниразу не публиковал я отзывов наших клиентов о работе.
Исправляюсь.
13.04.2011 Андрей
Я получил именно то, что хотел - развернутый статистический анализ по всем группам испытуемых (а я представил на анализ исследование по нескольким группам с разнородными данными), с четким описанием различий и сходств, с графиками и таблицами. Мне понравилась и скорость, и стоимость работы, и уровень взаимодействия с коллективом "6 сигма".

22.06.2011 Ирина
Получила, что ожидала, и даже больше!

***
Если вы хотите получить развернутые комментарии о работе аналитической группы "6 сигма" от наших клиентов, мы с радостью предоставим вам их электронные адреса (только с их разрешения).

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Несколько простых советов

Карл Броман из Школы Джона Хопкинса дает несколько советов как представлять данные плохо, а как - хорошо
Главная идея хорошего представления данных: данные должны быть собраны аккуратно и изложены ясно.

Несколько правил плохого представления данных:
•Показывать информации так мало, насколько это возможно.
•Затенять то, что вы реально хотите сказать (нежелательными графиками).
•Использовать псевдо-3D и цвет в неограниченном количестве.
•Делать круговые диаграммы (желательно в цвете и 3D).
•Использовать плохо выбранный масштаб.
•Игнорировать действительно значимые графики.

Несколько правил хорошего представления данных:
•Будьте аккуратны и излагайте ясно.
•Дайте данным говорить самим за себя.
•Представляйте столько информации, сколько возможно, НО заботьтесь о том, чтобы при этом не затенить главное.
•Наука не продается.
•Избегайте ненужных излишеств – особенно, необоснованного использования 3D.
•В таблицах, каждая цифра должна иметь значение.

How to display data badly
http://www.biostat.jhsph.edu/~kbroman
Karl W. Broman Department of Biostatistics
Johns Hopkins Bloomberg school of public health
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Заказы (аппроксимация)

Ранее перед нами не ставили задач по аппроксимации эмпирических данных.
Но, как говорится, всегда бывает первый раз!
Работаем!
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Чудо

Жизнь преподносит приятные сюрпризы, чему несказанно радуешься.
В череде проведенных статистических анализов особянком стоят работы по ПЛАНИРОВАНИЮ исследования (экспериментальный план). Таких работ можно по пальцам одной руки счесть. Проще собрать материал, а потом уже искать чем бы все это обработать.
Ну не принято у нас планировать исследование!
А жаль! :(
Неделю готовим план для медицинского исследования эффективности оперативных вмешательств при атеросклерозе. Интересно!!!

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Пора курсовых и дипломных

Апрель-май - горячая пора в вузе! Курсовики и дипломники выходят из спячки и лихорадочно начинают готовить свои квалификационные работы. Особенно часто в это время они вспоминают о своих научных руководителях ;)
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Хи-квадрат

Имеется существенное ограничение на использование критерия хи-квадрат (кроме предположения о случайном выборе наблюдений и независимости выборок) - ожидаемые частоты не должны быть очень малы.
Существует эмпирическое правило, помогающее определить минимальное значение ожидаемых частот, при котором применение критерия хи-квадрат можно считать корректным. Если количество степеней свободы df = 1, то ожидаемые частоты в каждой
ячейке не должны быть меньше 5. Если количество степеней свободы df > 1, то в таблице сопряженности не должно быть свыше 20% ячеек с ожидаемыми частотами ниже 5 и ни одной ячейки с ожидаемой частотой ниже 1.

Для таблиц сопряженности 2 х 2 с малыми частотами (меньше 10) рекомендуется рассчитывать эмпирическое значение критерия хи-квадрат, используя поправку на непрерывность Йетса (Yates’ correction for continuity)
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Заказы (номинальные шкалы)


Поступил интереснейший заказ на обработку данных психологического исследования о формировании образа "Я" у пациентов с разными типами зависимостей для статьи.

Еще раз убеждаемся в том, что с одной линейкой к двум разным исследованиям подходить нельзя. Номинальные шкалы, характерные для психологических и социологических исследований, не дают расслабиться.  

Номинальная шкала (nominal scale)
Шкала, числа которой служат только как ярлыки или метки для определения и классификации объектов со строгим, один к одному, соответствием между числами и объектами.

Числа в номинальной шкале используются для классификации как ярлыки для классов и категорий. Например, контрольную группу можно классифицировать как группу 1, а экспериментальную — как группу 2.

Операции с числами для номинальной шкалы следующие:
1. Нахождение частот распределения по пунктам шкалы с помощью процентирования или в натуральных единицах. Нетрудно подсчитать численность каждой группы и отношение этой численности к общему ряду распределения (частоты).
2. Поиск средней тенденции по модальной частоте. Модальный (Мо) называют группу с наибольшей численностью.
3. Самым сильным способом количественного анализа является в данном случае установление взаимосвязи между рядами свойств, расположенных неупорядоченно. С этой целью составляют перекрестные таблицы.

Помимо простой процентовки, в таблицах перекрестной классификации можно подсчитать критерий сопряженности признаков по Пирсону: хи-квадрат (х2) — простейший показатель обоснованности вывода о наличии или отсутствии связи между сопоставляемыми характеристиками, т. е. связанности качественных классификаций.
Взято отсюда >>>>>

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Н - критерий Крускала-Уоллиса

Частая проблема в применении статистиеских критериев - использование их без учета ограничений.. Например, критерий Стьюдента рекомендуется использовать в случае нормально распределенных выборок (а), или не рекомендуется использовать для множественных сравнений (б).
Описанные проблемы (а, б) легко можно обойти используя непараметрический критерий
Н - критерий Крускала-Уоллиса.

Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.
Критерий Н иногда рассматривается как непараметрический аналог метода дисперсионного однофакторного анализа для несвязных выборок.
Критерий является продолжением критерия U на большее, чем 2, количество сопоставляемых выборок.
Гипотезы
H0: Между выборками 1, 2, 3 и т. д. существуют лишь случайные раз¬личия по уровню исследуемого признака.
Н1: Между выборками 1, 2, 3 и т. д. существуют неслучайные разли¬чия по уровню исследуемого признака.
Ограничения критерия Н
1. Для того, чтобы диагностировать различия на уровнем значимости больше, чем 0,05, необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по край¬ней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2.
2. При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться Таблицей критических значений критерия χ2, поскольку критерий Крускала-Уоллиса асимптотически прибли¬жается к распределению χ2.
Количество степеней свободы при этом определяется по формуле: V=c-1 где с - количество сопоставляемых выборок.
3. При множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказать¬ся стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться ½•[c•(c-1)]* таких попарных сопоставлений используется, ес¬тественно, критерий для двух выборок, например U или φ*.


_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Совет № 4

Хорошее исследование начинается с гипотезы и продуманного экспериментального плана

Шесть необходимых элементов экспериментального плана (проекта):
1.Выдвинуть научную гипотезу, сформулировать идею, поставить проблему.
2.Определить объект исследования.
3.Установить продолжительность исследования и его масштабы (число изучаемых объектов).
4.Тщательно подобрать метод отбора проб.
5.Определить перечень статистических методов, которые будут использованы для анализа.
6.Определить тип эксперимента.

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Гарантии "6 сигма"

1.Мы занимается статистическим анализом данных уже 11 лет (сводка на сайте http://statanalys.ru);
2.Мы используем современные лицензионные ста-тистические пакеты, например, STATISTICA;
3.Написаны 3 книги по использованию статистиче-ских методов в помощь исследователю;
4.Нами выполнен анализ данных для 50 аспирантов, докторантов и соискателей, а также научных сотрудников НИИ и преподавателей вузов (сводка на сайте http://statanalys.ru).

Мы предоставляем качественную работу и гаран-тируем полную конфиденциальность, это дает нам надежду, что вы обратитесь к нам вновь, или поре-комендуете коллегам.

Мы гарантируем:
а) выполнение работы с учетом ваших требований;
б) конфиденциальность обращения к нам и условий, содержащихся в вашем заказе;
в) информирование о состоянии заказа по вашему за-просу.

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Скидки

Готовы в марте предложить скидку в 10% в течение всего марта исследователям-барышням, сударыням,дамам.
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Заказы

Поступило два новых заказа на обработку данных: для статьи в агробиологический журнал и для диссертационной работы по морфометрии.
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Эксперименты

Существует два типа экспериментов (Hurlbert, 1984):
1. Измерительный эксперимент - подразумевает измерение неких биологических признаков. В этом случае, исследователь не производит манипуляций с организмами или более крупными единицами. Например, Вы можете рассчитать плотность популяции кольчатых червей, обитающих в лесу и на лугу путем подсчета особей и делением их на площадь исследуемых площадок. Обратите внимание, что в этом случае (расчет плотности популяции) мы имеем дело с классическим примером косвенного измерения.
Прямое измерение, в данном случае, выглядело бы как простой подсчет количества особей на исследуемых площадках.
Измерительный эксперимент имеет свои достоинства и недостатки. Существует один вопрос, с которым часто сталкивается исследователь - это вопрос что измерять? Типична ситуация, когда некий сумасшедший эколог пытается измерить все. Не делайте этого, или Вы потеряете массу времени и денег собирая бесполезные данные .
2. Контролируемый эксперимент – предполагает наличие манипуляций с повторностями. В этом случае должно быть рассмотрено, по крайней мере, два отношения. Например, исследователь может сжечь один участок луга, а второй оставить нетронутым, а потом сравнить их.

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

У истоков биометрии

У истоков биометрии стоял Френсис Гальтон. В его книге посвященной природной наследственности изданной в 1889 г. им впервые было введено в употребление слово «biometry». Ф.Гальтон заложил основы новой науки и дал ей имя. Однако превратил ее в стройную научную дисциплину математик Карл Пирсон (1857-1936).
Важное место в истории биометрии занимает имя великого английского статистика Рональда Фишера (1890-1962), который известен как основоположник современной прикладной статистики, заложивший и разработавший ее основные идеи.
Назовем еще одно имя - английский статистик Вильям Госсет***, который в начале 20-го столетия предложил наиболее часто применяющийся в медико-биологических исследованиях t-критерий Стьюдента, подписав свою статью о нем псевдонимом «Student».
С середины XX века статистические методы начинаю повсеместно использоваться в биологии, однако и здесь не все так гладко (об ошибках в применении статистики в биологии будет сказано ниже).
Более подробно об истории статистики читайте Терентьев П.В. Математизация биологии //Труды Ленинградского общества естествоис-пытателей, 1975. -Т.LXXII.-В.5.-С.5-8.

***Леонов В.П. История биометрики и ее применения в России//Международный журнал ме-дицинской практики, 1999.-В.4.-С. 7-19.
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Совет №3

Читайте хорошие книги учебники

1. Гланц С. Медико-биологическая статистика. Пер. с англ.-М.: Практика, 1998.-459 с.
2. Джонсон Н., Лион Ф. Статистика и планирование эксперимента в технике и науке: Методы обработки данных.-М.: Мир, 1980.- 602 с.
3.Сидоренко Е. В. Методы математической обработки в психологии.-Спб.: ООО «Речь», 2003.- 350 с.
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Совет №2

... язык математической статистики еще не стал родным языком экспериментатора. Экспериментатору пользоваться им так же трудно, как каждому из нас пользоваться малознакомым иностранным языком. .... Возникает необходимость в появлении специалистов нового профиля - статистиков-консультантов».
Налимов В.В. Теория эксперимента.
Статистический метод – это инструмент: в умелых руках – он дает точные результаты, в неграмотных – иллюзию объективности.
Не зазорно и полезно обратиться к специалистам (6 сигма) по статистической обработке данных, чтобы снять все возможные вопросы по применению критериев.
На западе уже давно распространена совместная работа исследователя и специалиста по статистической обработке данных.

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Что за значимость?

Перевод статьи: Zucker Hank «What is significance?» //Quirk's Marketing Research Review (www.quirks.com), 1994.-№ 0092.

«Уровень значимости» термин, который вводит в заблуждение многих исследователей.Обычно, «значимый» означает важный, в то время как в статистике «значимый» означает, возможно достоверный (истинный, справед-ливый). Исследовательский поиск может быть достоверным, не будучи важным. Когда статистики говорят, что результат «высоко значим» они имеют в виду, что «высокая вероятность справедливости, истинности». Это не обязательно означает, что результат очень важен.
Для примера рассмотрим запись в примечании к таблице одного исследования: Хи-квадрат 0,07 (P=0,795) и Хи-квадрат 24,37 (P=0,001). Это и есть уровни значимости для реальных значений критерия Хи-квадрат.
Уровень значимости показывает, какова вероятность получение истинного (достоверного) результата. Чаще все используется уровень значимости в 95% - достаточный, чтобы быть достоверным. Это означает, что в 95% случаев результат будет правдивым. Однако, как показывает практика, это значение также вводит в заблуждение. Нет статистических программ, показывающих вам значения «95%» или «0,95» для указанного уровня значимости. Вместо этого, они показывают «0,05», что означает, что полученный результат ложен (неправилен) в пяти процентах (0,05) случаев (то же самое, как 95% процентов случаев правдив).
Чтобы найти значение уровня значимости необходимо вычесть указанное число из единицы. Например, значе-ние «0,01» означает, что в 99% (1 - 0,01 = 0,99) случаев наблюдаемые явления достоверны.
Если, например, t-критерий Стьюдента показал уровень значимости 0,07, это означает, что существует 93% уверенность в том, что два средних, сравниваемых выборок будут действительно отличаться.
Иногда думают, что уровень значимости 95% это некое магическое (священное) число. Если тест показывает уровень значимости 0,06, это означает, что в 94% случаев наблюдаемые явления достоверны. Но вы не можете быть абсолютно уверены, также, как и в случае с 95%. В научных публикациях уровень 0,05 (95%) - это тот уровень, который принят как достаточный, чтобы доказать свои предположения.
Если вы проводите большое количество тестов (например множественные сравнения), ложные положительные результаты могут стать серьезной проблемой. Помните, что на 95% правды остается 5% ошибок. Поэтому, если 100 тестов показали уровень значимости 0,05 (95%), среди них остается еще 5% неверных предположений. Вы не можете сказать, какие результаты ложные, а какие истинные - просто знайте, что они есть.
Для небольшой выборки вы можете либо ограничить число тестов или, что лучше, повторить исследование и посмотреть, получится ли тот же результат. Если что-то является статистически значимым в двух отдельных исследованиях, оно, вероятно, и на самом деле справедливо.
И последнее, проверяйте процедуры отбора образцов, чтобы избежать предвзятости. Вносите случайность в эксперимент, рандомизируйте.

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________