Мало данных — много данных

Во многих работах, посвященных методологии статистического анализа биомедицинских, гуманитарных и иных данных говорится о проблеме малых выборок. Частое явление,

когда по собранному немногочисленному материалу исследователи пытаются сделать «какую-нибудь статистику». Результат зачастую оказывается плачевным.

Когда у исследователя на руках большой массив данных — у него возникает ощущение хорошо проделанной работы, в которой можно получить серьезные аргументированные выводы.  Когда к нам, в аналитическую группу «6 сигма» поступают заказы на обработку таких больших объемов данных это значит много интересной работы, по подбору критериев, статистическому анализу данных и их интерпретации, но ….

Но оказывается, что предстоит долгая работа с заказчиком с тем, чтобы стандартизировать исходную таблицу данных, зашифровать текстовые переменные, добиться понимания заказчика указанных процедур и, зачастую, ликбеза по простым стат.операциям.

После указанных процедур, наши заказчики с удивлением обнаруживают некоторые «глазом видимые» закономерности, которые ранее были скрыты за горой столбцов и текста.

В 80% случаем, такая вот «каша из букв и цифр» связана с отсутствием грамотно составленного экспериментального плана, где и должны были быть предварительно описаны гипотезы, варианты зависимых и независимых переменных, возможные статистические критерии (более подробно об экспериментальном плане, читайте Гавриков Д.Е. «Статистические методы в экологических исследованиях», 2008, 2012 г.

Оставьте комментарий. Читайте сайт 6 Сигма