Новый год 2014

«В жизни, как правило, преуспевает больше других тот, кто располагает лучшей информацией» Benjamin Disraeli

Уважаемые коллеги и дорогие клиенты,
аналитическая

группа «6 сигма» поздравляет вас с новым годом и Рождеством!
Успехов вам в новом году!
happy-NY2013

Оставьте комментарий. Читайте сайт 6 Сигма

Акция декабря 2013

Дорогие друзья, компания 6 сигма проводит статистические анализы данных вот уже 13 лет.
Мы решили завершить 2013 год этим замечательным числом 13.
В декабре

и январе делаем 13% скидку на подбор критериев + статистический анализ данных + интерпретацию данных для вашей статьи, диссертации.
Если средняя стоимость* диссертационного исследования составляет 19000 рублей, скидка в 2500 руб. кажется весьма привлекательной.

* стоимость работы определяется объемом данных и требуемых критериев; видом работы; сроками выполнения работы (от 3 недель для диссертации)

Оставьте комментарий. Читайте сайт 6 Сигма

Еще раз про объемы выборок

Часто приходится слышать вопрос: «Сколько нужно особей (вариант, пробирок, единиц….) для исследования?
Иными словами, «Каков достаточный объем выборки
Отталкиваться,

конечно, нужно от каждого конкретного случая, но в общем виде запомним:

30 – это магическое число объема выборки — пограничное между малыми и большими выборками.
При n>30: распределение очень тесно описывается нормальным и поэтому вариациями вследствие объема выборки можно пренебречь [Колкот Э. Проверка значимости. - М.: Статистика, 1978].
При n<30: вероятность выявления закономерностей, там где их нет, т.е. вероятность допущения ошибки, больше, чем для выборок с объемом больше 30.

Оставьте комментарий. Читайте сайт 6 Сигма

Работа над диссертацией (2)

Работа над диссертацией — это сложное дело, занимающее большое количество времени, от выбора темы до представления к защите проходит иногда 3-4, иногда 10 лет.

Сколько страниц чернового текста приходится написать аспиранту, прежде чем он превратится в научный труд?

Мы посчитали, в среднем, для естественнонаучной диссертации.

В разделе «Результаты и обсуждение» представлена статистическая обработка данных и их интерпретация.

Это тот раздел, в котором в полной мере раскрывается квалификация специалиста.

3

Мы, в 6 Сигма, уверены, что совместными усилиями мы можем сделать работу лучше. Обычный отчет о проведенной работе представлен 25-30 страницами текста с таблицами и графиками, где интерпретируются полученные результаты с точки зрения статистики. Обычно, после этого, заказчику требуется добавить предметную интерпретацию данных.

На наш взгляд выгоды очевидны!

 

Оставьте комментарий. Читайте сайт 6 Сигма

О роли междометия «ой» в русской культуре и статистике

Думаю, будут еще написаны диссертации, посвященные этому замечательному междометию и важности его для русского народа.

Как много и как часто используем мы

это междометие в жизни: садимся на стул «ой», встаем со стула «ой», прихватило спину «ой», произошло что-либо неожиданное «ой» и еще много и много тысяч раз «ой», «ой», «ой» ….
Поискать бы статистические закономерности :) :)  :)

Оставьте комментарий. Читайте сайт 6 Сигма

Работа над диссертацией

Если оценить среднее время, которое тратит аспирант на написание диссертации, то это будет ~2 года (730 дней).
Причем по основным разделам это время распределяется

следующим образом:

6 мес. (25%) Литературный обзор;
7 мес. (30%) Эксперимент;
10 мес. (45%) Результат и обсуждение

время-на-дисс

Мы оценили сколько, в-среднем, Аналитическая группа 6 Сигма тратит времени на анализ диссертации и получилось 1,3 месяца, что при учете необходимости предметно интерпретировать полученные данные, а не только с точки зрения статистики, превращается в 2,5 месяца.

На наш взгляд экономия времени налицо !

Оставьте комментарий. Читайте сайт 6 Сигма

Отзыв (ноябрь)

По окончании работы мы всегда просим своих клиентов оставить отзыв о работе.
Нам нужна эта обратная связь, чтобы учесть возможные недочеты и быть лучше.
В

ноябре закончили статистическую обработку данных кандидатской диссертации по психологии из Украины и получили отзыв на работу:

«Понравился подход к выполнению работы, предоставление предварительных консультаций.
После просмотра примера отчета о проделанной работе окончательно решилась на сотрудничество.
Грамотно, четко и быстро! Полученный результат меня полностью удовлетворил.»

Оставьте комментарий. Читайте сайт 6 Сигма

И еще раз про нормальность

Совет при проверке выборочной совокупности на соответствие нормальному распределению используйте критерии согласия Колмогорова-Смирнова, Лилиефорса, Шапиро-Уилка,

причем:

при n<50 использовать результат по тесту Шапиро-Уилка, как наиболее надежный;
при n>50 — критерии Колмогорова-Смирнова или Лилиефорса

Лучше опираться на критерий Шапиро-Уилка, когда результаты по данному критерию и по тесту Лилиефорса разнятся.

Обратите внимание, чем меньше наблюдений в выборке, тем более вероятность сделать заключение о нормальности распределения.

Если в исследуемой выборке менее 20 наблюдений используйте непараметрические критерии!

Оставьте комментарий. Читайте сайт 6 Сигма

Полезное видео

Вебинар «STATISTICA для медицинских приложений: актуальные задачи»

Оставьте комментарий. Читайте сайт 6 Сигма

Чудная цитатка

Думали ли они, что науки, основанные на наблюдении, могут стимулироваться только статистикой?.Если бы медицина не пренебрегла этим инструментом, это означало

бы прогресс, она обладала бы большим числом реальных истин, стала бы менее подверженной обвинению в том, что является наукой нетвердых принципов, неуловимых и предположительных.

Jean-Etienne Dominique Esquirol в журнале «Lancet», 1838

Оставьте комментарий. Читайте сайт 6 Сигма

Вакансии

Требуется специалист по биостатистике с опытом работы:
высшее математическое образование, желательно ученая степень, знание программ: STATISTICA / SPSS / R.
График

работы свободный. Заработная плата договорная.
Функционал отправим по запросу на ваш e-mail.

Оставьте комментарий. Читайте сайт 6 Сигма

20 ошибок стат.анализа (2)

Ошибка 2. Непрерывные данные представлены в виде порядковых без объяснения причин и способа преобразования

Для облегчения статистического анализа непрерывные

данные можно представить в виде двух и более порядковых категорий, например рост в см как низкий, нормальный и высокий. Однако такое упрощение уменьшает точность результатов и вариабельность данных. Автор должен объяснить, почему он сделал это. Кроме того, следует описать критерии выбора диапазона значений в рамках каждой из порядковых категорий, чтобы избежать возможности появления систематической ошибки. В некоторых случаях преобразование непрерывных данных в порядковые имеет целью подгонку конечных результатов под желаемую схему

Впервые опубликовано Т. Lang. Twenty Statistical Errors Even YOU Can Find in Biomedical Research Articles. Croatian Medical Journal 2004:45(4):361-370.

Оставьте комментарий. Читайте сайт 6 Сигма

20 ошибок стат.анализа (1)

Ошибка 1. Количественные данные представлены с излишней точностью

Большинство из нас легче воспринимают количественные данные, представленные одной или двумя

цифрами, чем тремя и более. Поэтому округление улучшает восприятие материала. Рассмотрим пример, в котором количество участников (как мужчин, так и женщин) на момент окончания исследования примерно в 3 раза превышает таковое в начале, однако этот факт становится очевидным лишь после округления соответствующих показателей:

Число женщин возросло с 29 942 до 94 347, мужчин – с 13 410 до 36 051.
Число женщин возросло с 29 900 до 94 300, мужчин – с 13 400 до 36 000.
Число женщин возросло примерно с 30 000 до 94 000. мужчин – с 13 000 до 36 000.

Во многих случаях необязательно приводить максимально точные значения. Если масса тела больного составляет 60 кг, то использование показателя 60,18 кг только затруднит восприятие, несмотря на то, что формально он соответствует действительности. По этой же причине наименьшая величина р, которую имеет смысл представлять, p < 0,001.

Впервые опубликовано Т. Lang. Twenty Statistical Errors Even YOU Can Find in Biomedical Research Articles. Croatian Medical Journal 2004:45(4):361-370.

Оставьте комментарий. Читайте сайт 6 Сигма

Частотный подход в статистике

Классический (частотный) подход в статистических исследованиях связан с тремя корифеями: сэр Рональд Фишер (нулевая гипотеза и р-значения для доказательства

против нулевой гипотезы); Ежи Нейман и Карл Пирсон (I и II типы ошибки, критерий согласия (критерий хи-квадрат).

Стандартная статистическая процедура выглядит примерно так:

Начинаем с нулевой гипотезы (H0), в котором говорится, что нет никакого эффекта или отношения.
Рассматриваем альтернативную ( или конкурирующую) гипотезу (H1), которая может говорить только о том, что H0 не верна (т.е. есть некоторый эффект или отношения) Иными словами, имеем две гипотезы, по результатам рассмотрения которых: будет принято решение о справедливости для генеральной совокупности гипотезы Н0; будет принято решение о справедливости для генеральной совокупности гипотезы Н1.
Выбираем альфа-уровень, или уровень значимости (обычно волшебное 0,05). Уровень значимости альфа — это вероятность ошибки первого рода, т.е. вероятность того, что будет принята гипотеза Н1 , если на самом деле в генеральной совокупности верна гипотеза Но.
Выполняем статистический тест и рассчитываем р-значение. Если значение р меньше, чем альфа-уровень результат называется «значимым».

  • Этот подход, часто упоминается как проверка гипотез или нулевое значение тестирования гипотезы (NHST), был подвергнут критике по ряду причин (Cohen, 1994; Лофтус, 1996; Kline, 2004; Gigerenzer, 2004; Goodman, 2008; Станг и др. ., 2010).

Вот лишь некоторые аргументы против частотного подхода:

  • p-значения не дают ответа на вопросы (поскольку это вероятность)
  • H0 часто является заведомо ложной
  • p-значения имеют широкий диапазон ошибочности
  • приводит к двоичности мышления
  • предварительная информация никогда не принимаются во внимание (байесовский аргумент)
  • небольшое р-значение может отражать очень большой размер выборки, а не значимой разницы
  • приводит к систематической ошибке

Оставьте комментарий. Читайте сайт 6 Сигма

Осеннее

Осенне-физическое и статистическое














Оставьте комментарий. Читайте сайт 6 Сигма

Статистика души

Подлец, что прикинулся человеком,
Сумел оболгать меня и надуть.
А мне говорят: — Наплевать, забудь!
Зло ведь живет на земле от века!

А мне говорят: — Не

печалься, друг,
Пусть в горечи сердце твое не бьется,
На сотню хороших людей вокруг
Плохих и с десяток не наберется!

А впрочем, тебя-то учить чего?! —
Все так, но если признаться строго,
То мне десяти негодяев много,
Мне лишку порою и одного…

И, если быть искренним до конца,
Статистика — слабый бальзам от жала.
Когда пострадаешь от подлеца,
То цифры, увы, помогают мало!

И все-таки сколько б теперь нашлось,
По данным, хороших людей и скверных?
Не знаю, как цифры, но я, наверно,
Ответил бы так на такой вопрос:

Все выкладки — это столбцы, и только.
Но если доподлинный счет вести,
То скверных людей в этом мире столько
И честных людей в этом мире столько,
Сколько ты встретишь их на пути!

Эдуард Асадов

Оставьте комментарий. Читайте сайт 6 Сигма

Универсальные критерии

Работая над статистическим анализом и общаясь с заказчиками попадаются некоторые стереотипные вопросы, один из таковых:
"Меня немного беспокоит, что критерии, которые Вы используете используются для обработки данных исследований в области медицины... а не психологии ..."

Один из возможных ответов на такой вопрос:
Статистический аппарат обладает большим количеством разнообразных критериев и неважно, что некоторые критерии не совпадают с теми, что коллеги используют в своих работах.
При выборе критерия, мы (6 сигма) руководствуемся не соответствием выбранных критериев большинству работ, а целесообразностью.
То что ряд классических критериев, широко используемых в биологии/медицине не используются в психологии, говорит не в пользу последней.

Правила хорошего статистика

Здесь только малая часть правил хорошего статистика.
Правило №1
Не все, что может быть измерено, должно быть измерено.
Правило №2
Статистический метод – это инструмент: в умелых руках – он дает точные результаты, в неграмотных – иллюзию объективности.
Не зазорно и полезно обратиться к специалистам.
Правило №3
Читайте хорошие книги учебники.
Правило № 4
Хорошее исследование начинается с гипотезы и продуманного экспериментального плана.
Правило №5
Эксперимент чаще всего должен иметь контроль.
Правило № 6
Избегайте мнимых (псевдо)повторностей.
Правило №7
Рандомизируйте где это только возможно.
Правило № 8
Если мусор (ошибки) на входе, то мусор (ошибки) на выходе.
взято отсюда >>>>

Редкая радость

Еще раз хочу поделиться радостью.

На нашей улице праздник: в руки попалось второе издание уникальной книги «Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов» от Томаса А. Ланга и Мишелль Сесик.

Из аннотации: «Она не имеет аналогов на русском языке и представляет чрезвычайную ценность для исследователей в области медицины и биологии. Учитывая отсутствие единообразия в описании статистических методов в отечественной медицинской науке, книга станет полезным пособием для специалистов, разделяющих принципы доказательной медицины. Простой и доступный язык изложения сложных понятий в сочетании с примерами способен выработать у читателя устойчивый навык корректного и достаточно полного описания методов статистики. Следование этим рекомендациям гарантирует читательское понимание описаний результатов исследования, что, в свою очередь, значительно повысит вероятность цитирования этих работ.
Достоинством этого издания является «Путеводитель по статистическим терминам и критериям», который поможет читателям разрешить терминологические проблемы, возникающие при написании статей, а также существенно облегчит понимание англоязычных статей.»

Здесь можно оставить свои комментарии. Выпуск подготовленплагином wordpress для subscribe.ru

Отзывы

Что-то давненько не публиковал я отзывов наших клиентов о работе.Исправляюсь.
23.04.2013 Марина
В полном объеме получила именно то, что хотела — развернутый статистический анализ экспериментальных данных по всем группам испытуемых (а я представила на анализ исследование по нескольким группам с разнородными данными), с четким описанием различий и сходств, с графиками и таблицами. Мне понравилась и скорость, и стоимость работы, и уровень взаимодействия с коллективом «6 сигма».
12.02.2012 Максим
Получил, что ожидал, и даже больше!
***
Если вы хотите получить развернутые комментарии о работе аналитической группы «6 сигма» от наших клиентов, мы с радостью предоставим вам их электронные адреса (только с их разрешения).
Share

Обновления

В октябре сайт statanalys.ru окончательно перешел на новую платформу управления.
Скоро ждите дополнительные сервисы и возможности. Ждем пожеланий и комментариев на адрес stat6sigma@rambler.ru
Share

Facebook

Теперь мы и на Facebook! Добро пожаловать! https://www.facebook.com/statanalys
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Работа этого месяца

Закончена очень интересная работа по анализу данных для кандидатской диссертации (динамика биржевых индексов).
С таким массивом данных нам еще не приходилось работать!

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Новое

Компания "6 сигма" предлагает вам новую услугу - бесплатная первичная консультация по статистическому анализу ваших данных.
Не стесняйтесь!
Отправьте заявку по e-mail stat6sigma@rambler.ru
или оставьте заявку на сайте >>>

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

О голове

Замечательная иллюстрация для того, чтобы задуматься ЗАЧЕМ, КОМУ это нужно, КАКИЕ данные нужно и можно сравнивать















_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Как лгать при помощи статистики

Интересный материалец нашелся в сети:
D. Huff. How To Lie With Statistics
Книга представляет собой набор трюков с примерами, с помощью которых заинтересованные лица вводят в заблуждение доверчивых зрителей, читателей и слушателей. Многие приемы активно используется в рекламе, поэтому наши сограждане такие «грамотные» и знают много научных «фактов» и «открытий». Причем манипуляторы не всегда прибегают к откровенному обману. Иногда достаточно где-то не договорить или использовать обтекаемую формулировку. В результате говорится об одном, а народ видит и запоминает совсем другое.....

читать далее >>>

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Заполнение пропусков


При проведении исследований, часто, по разным причинам можно наблюдать пропуски, отсутствующие данные.
При этом собрать материал не представляется возможным и велик соблазн заполнить пропуски.

Мы считаем, что заполнять пропуски данных средними значениями нежелательно:
а) "..такие алгоритмы хотя и привлекательны, но дают слишком оптимистические результаты, которые обычно потом не подтверждаются при проверке работоспособности мат.модели...." (Реброва О.Ю. Статистический анализ медицинских данных....-М., МедиаСфера, 202.-312 с.

б) "…..самым простейшим приемом анализа неполных данных является исключение некомплектных наблюдении, содержащих пропуски хотя бы в одной из переменных, и дальнейший анализ полученных таким образом “полных” данных. Вполне понятно, что такой подход приводит к сильному различию статистических выводов, сделанных при наличии в данных пропусков и при их отсутствии.
Большинство программных средств использует такие методы заполнения пропусков, как средневыборочные по присутствующим значениям, с помощью уравнения регрессии или главных компонент. Подобные методы заполнения приводят к тому, что распределение данных после заполнения будет существенно отличаться от истинного распределения и представлять собой смесь истинного и вырожденных распределений (распределений, соответствующих некомплектным наблюдениям с различными структурами пропусков) с вырождением на гиперплоскостях, на которых располагаются предсказываемые значения.
Оценки параметров таких “полных” данных не будут отвечать требованиям состоятельности и несмещенности. Качество оценок с увеличением доли пропусков будет ухудшаться. Кроме того, если параметры для заполнения пропусков вычисляются по присутствующим данным, как в рассматриваемых методах, то появляется зависимость между наблюдениями…" (Чурилова Э. Ю. Проблемы неполных данных при исследовании деятельности малых предприятий, 1998)


_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

11%

..... в работе рассмотрено 53 статьи, посвященных изучению рака: исследователи попытались воспроизвести результаты этих работ (важно то, что они общались с авторами оригинальных статей, получали от них дополнительные данные и и т.д.).

Только в 11% случаев удалось воспроизвести результаты.

http://www.nature.com/nature/journal/v485/n7396/full/485041e.html
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Литотрипсия

Проведен статистический анализ данных исследования по влиянию объема и радиоплотности камней в почках на исходы литотрипсии

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Неожиданное

В результате статистической обработки изображений и сравнения их с матрицей выяснилось, что художники верхнего палеолита ошибались в 46,2% случаев, рисуя походку четвероногих, а  вот художники и скульпторы исторической эпохи, включая самых дотошных исследователей природы, таких как Леонардо да Винчи, в 83,5% случаев изображали походку животных неверно

Можно сказать, что художники той поры если и изображали лошадь правильно, то по чистой случайности. Следует отметить, что ваятели грешили неточностями несколько реже живописцев, поскольку при некоторых положениях конечностей, изображенных на картинах, статуи просто не держались бы на ногах. ......

источник >>> 
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Эксп.план

Хорошее дело - прежде чем начать экспериментировать - хорошенько все спланировать.
Редкое пока дело, и тем более радостное.
Получили заказ на создание экспериментального плана докторской диссертации по медицине.

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Махинации

Ранее мы уже обсуждали этот вопрос и теперь возвращаемся к нему - махинации в науке.
Любопытная статья, обратите внимание, что часто махинации связаны с манипуляциями с данными.

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Полураспад


....В 2005 году врач и статистик Джон Иоаннидес опубликовал в журнале PLoS Medicine статью «Почему большая часть публикуемых данных исследований неверна». Иоаннидес каталогизировал изъяны большей части биомедицинских исследований, указывая на то, что маленькие отчёты реже оказываются верными, что постулируемые эффекты по большей части слабы, формы и выводы отчётов слишком гибки, финансовые и нефинансовые конфликты интересов встречаются повсеместно, а конкуренция в этой области является жёсткой. Иоаннидес заключил, что «для многих современных областей науки провозглашённые результаты исследований могут часто являться просто точными измерениями старых предрассудков». Тем не менее, наука продолжает двигаться вперёд, порождая новые факты и изменяя старые.

Другая причина, по которой персональные знания разлагаются, заключается в том, что люди цепляются к тем «фактам», которые подтверждают их слепую веру в устройство нашего мира. Арбесман замечает: «Мы склонны добавлять к нашим знаниям только те факты, которые согласуются с тем, что мы уже знаем, вместо того чтобы принимать любые факты — независимо от того, меняют ли они нашу картину мира». Это очень верно. «Подтверждающий» уклон распространён повсеместно.....

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________