20 ошибок стат.анализа (7)

Ошибка 7. Отсутствует указания методов и обоснование их использования
В тексте статьи должно присутствовать название использованного метода и подтверждение

того, что он применим для анализа имеющихся данных.
Например: полученные результаты подчиняются нормальному распределению, что позволяет использовать t тест.
Наиболее характерные ошибки:

  • использование параметрических методов (основанных на предположении о нормальном распределении данных) для анализа данных, не подчиняющихся нормальному распределению (в частности, при сравнении двух групп нередко используют критерий Стьюдента, хотя более оправдано применение критерия Вилкоксона или другого непараметрического метода);
  • использование методов, предназначенных для независимых выборок, при анализе парных данных (в этом случае нередко применяют критерий Стьюдента, а не парный t тест).

Впервые опубликовано Т. Lang. Twenty Statistical Errors Even YOU Can Find in Biomedical Research Articles. Croatian Medical Journal 2004:45(4):361-370.

Оставьте комментарий. Читайте сайт 6 Сигма

Мало данных — много данных

Во многих работах, посвященных методологии статистического анализа биомедицинских, гуманитарных и иных данных говорится о проблеме малых выборок. Частое явление,

когда по собранному немногочисленному материалу исследователи пытаются сделать «какую-нибудь статистику». Результат зачастую оказывается плачевным.

Когда у исследователя на руках большой массив данных — у него возникает ощущение хорошо проделанной работы, в которой можно получить серьезные аргументированные выводы.  Когда к нам, в аналитическую группу «6 сигма» поступают заказы на обработку таких больших объемов данных это значит много интересной работы, по подбору критериев, статистическому анализу данных и их интерпретации, но ….

Но оказывается, что предстоит долгая работа с заказчиком с тем, чтобы стандартизировать исходную таблицу данных, зашифровать текстовые переменные, добиться понимания заказчика указанных процедур и, зачастую, ликбеза по простым стат.операциям.

После указанных процедур, наши заказчики с удивлением обнаруживают некоторые «глазом видимые» закономерности, которые ранее были скрыты за горой столбцов и текста.

В 80% случаем, такая вот «каша из букв и цифр» связана с отсутствием грамотно составленного экспериментального плана, где и должны были быть предварительно описаны гипотезы, варианты зависимых и независимых переменных, возможные статистические критерии (более подробно об экспериментальном плане, читайте Гавриков Д.Е. «Статистические методы в экологических исследованиях», 2008, 2012 г.

Оставьте комментарий. Читайте сайт 6 Сигма