... В своей известной статье «Professor Tinbergen’s Method» Кейнс пишет, что Тинберген «предпочитает лабиринты арифметики лабиринтам логики». Он говорит, что эконометрический анализ становится похож на «детские головоломки, в которых вам нужно написать ваш возраст, умножить на что-то, прибавить еще что-то, вычесть и в конце концов получить число зверя из Откровения св. Иоанна Богослова»[21].
Этот блог аналитической группы "6 сигма" - статистический анализ экспериментальных данных для студента, аспиранта, ученого, педагога
Теорема Байеса
Теорема Байеса имеет дело с расчетом вероятности верности гипотезы в условиях, когда на основе наблюдений известна лишь некоторая частичная информация о событиях. Другими словами, по формуле Байеса можно более точно пересчитывать вероятность, беря в учет как ранее известную информацию, так и данные новых наблюдений. Главная, видимо, особенность теоремы Байеса в том, что для ее практического применения обычно требуется огромное количество вычислений-пересчетов, а потому расцвет методов байесовых оценок пришелся аккурат на революцию в компьютерных и сетевых инфотехнологиях.
Пример, из 20 студентов, пришедших на экзамен, 8 подготовлены отлично, 6 - хорошо, 4 - посредственно и 2 - плохо.
В экзаменнационных билетах всего 40 вопросов.
Студент подготовленный отлично, знает все вопросы, хорошо - 35, посредственно - 25 и плохо - 10 вопросов.
Некий студент ответил на все билеты.
Какова вероятность того, что он подготовлен плохо?
Гипотезы прихода на экзамен отличника (8/20), хорошиста (6/20), троечника (4/20), двоечника (2/20).
Есть вероятность того, что среди вопросов билета студент выпадет знакомый (40/40, 35/40, 25/40, 10/40 соответсвенно).
Вероятность что хорошо ответил отличник Ротл=(8/20)*1=2/5; хорошист - Рхор=(6/20)*(35/40)=21/80; троечник - Ртро=(4/20)*(25/40)=1/8; и, наконец, двоечник - Рдво=(2/20)*(10/40)=1/40.
Применяя теорему Байеса, вычисляем вероятность того, что ответивший студент был двоечником
Р[сдал/двоечник]=Рдво/(Рдво+Ртро+Рхор+Ротл)=(1/40)/(1/40+1/8+21/80+2/5)=2/65
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
Пример, из 20 студентов, пришедших на экзамен, 8 подготовлены отлично, 6 - хорошо, 4 - посредственно и 2 - плохо.
В экзаменнационных билетах всего 40 вопросов.
Студент подготовленный отлично, знает все вопросы, хорошо - 35, посредственно - 25 и плохо - 10 вопросов.
Некий студент ответил на все билеты.
Какова вероятность того, что он подготовлен плохо?
Гипотезы прихода на экзамен отличника (8/20), хорошиста (6/20), троечника (4/20), двоечника (2/20).
Есть вероятность того, что среди вопросов билета студент выпадет знакомый (40/40, 35/40, 25/40, 10/40 соответсвенно).
Вероятность что хорошо ответил отличник Ротл=(8/20)*1=2/5; хорошист - Рхор=(6/20)*(35/40)=21/80; троечник - Ртро=(4/20)*(25/40)=1/8; и, наконец, двоечник - Рдво=(2/20)*(10/40)=1/40.
Применяя теорему Байеса, вычисляем вероятность того, что ответивший студент был двоечником
Р[сдал/двоечник]=Рдво/(Рдво+Ртро+Рхор+Ротл)=(1/40)/(1/40+1/8+21/80+2/5)=2/65
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
Совет №5
Эксперимент чаще всего должен иметь контроль
Эксперимент всегда связан с проведением измерений повторностей (наименьшая часть изучаемого материала, которая может быть подвергнута воздействию изучаемого фактора независимо от воздействия на другие повторности). Контроль необходим для сравнения и определения влияния или невлияния изучаемого фактора (-ов).
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
Эксперимент всегда связан с проведением измерений повторностей (наименьшая часть изучаемого материала, которая может быть подвергнута воздействию изучаемого фактора независимо от воздействия на другие повторности). Контроль необходим для сравнения и определения влияния или невлияния изучаемого фактора (-ов).
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
10 простых правил по формированию и сохранению научной репутации
Rule 1: Think Before You Act : Правило 1: Подумайте, прежде чем делать
Rule 10: Never Plagiarize or Doctor Your Data : Правило 10: Никогда не занимайтесь плагиатом или исправлением данных
Bourne P.E., Barbour V. (2011) Ten Simple Rules for Building and Maintaining a Scientific Reputation. PLoS Comput Biol 7(6): e1002108. doi:10.1371/journal.pcbi.1002108
Rule 10: Never Plagiarize or Doctor Your Data : Правило 10: Никогда не занимайтесь плагиатом или исправлением данных
Bourne P.E., Barbour V. (2011) Ten Simple Rules for Building and Maintaining a Scientific Reputation. PLoS Comput Biol 7(6): e1002108. doi:10.1371/journal.pcbi.1002108
_______________
© 6 сигма - статистический анализ экспериментальных данных ______________________________________________________________
Кухня
Из чего складывается стоимость:
1. Из всего многообразия существующих статистических критериев не существует идеального, подходящего под все исследовательские задачи, поэтому, при обработке данных важно правильно группировать данные, определить статистический критерий, с учетом всех ограничений, которые накладывают на нас уже собранные данные.
2. Кроме того, при выборе критериев часто необходимо проверить, например, гипотезу о нормальности распределения.
3. Как правило приходится использовать не один критерий, а несколько.
4. Проведение анализа выбранными ранее критериями не выглядит как простой перенос данных, например, в программу STATISTICA и расчет одной кнопкой.
5. Много времени занимает интерпретация данных, потому что не всегда цифры говорят сами за себя. Объяснение полученых или неполученых различий это серьезная аналитическая работа.
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
1. Из всего многообразия существующих статистических критериев не существует идеального, подходящего под все исследовательские задачи, поэтому, при обработке данных важно правильно группировать данные, определить статистический критерий, с учетом всех ограничений, которые накладывают на нас уже собранные данные.
2. Кроме того, при выборе критериев часто необходимо проверить, например, гипотезу о нормальности распределения.
3. Как правило приходится использовать не один критерий, а несколько.
4. Проведение анализа выбранными ранее критериями не выглядит как простой перенос данных, например, в программу STATISTICA и расчет одной кнопкой.
5. Много времени занимает интерпретация данных, потому что не всегда цифры говорят сами за себя. Объяснение полученых или неполученых различий это серьезная аналитическая работа.
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
Отзывы
Что-то ниразу не публиковал я отзывов наших клиентов о работе.
Исправляюсь.
13.04.2011 Андрей
Я получил именно то, что хотел - развернутый статистический анализ по всем группам испытуемых (а я представил на анализ исследование по нескольким группам с разнородными данными), с четким описанием различий и сходств, с графиками и таблицами. Мне понравилась и скорость, и стоимость работы, и уровень взаимодействия с коллективом "6 сигма".
22.06.2011 Ирина
Получила, что ожидала, и даже больше!
***
Если вы хотите получить развернутые комментарии о работе аналитической группы "6 сигма" от наших клиентов, мы с радостью предоставим вам их электронные адреса (только с их разрешения).
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
Исправляюсь.
13.04.2011 Андрей
Я получил именно то, что хотел - развернутый статистический анализ по всем группам испытуемых (а я представил на анализ исследование по нескольким группам с разнородными данными), с четким описанием различий и сходств, с графиками и таблицами. Мне понравилась и скорость, и стоимость работы, и уровень взаимодействия с коллективом "6 сигма".
22.06.2011 Ирина
Получила, что ожидала, и даже больше!
***
Если вы хотите получить развернутые комментарии о работе аналитической группы "6 сигма" от наших клиентов, мы с радостью предоставим вам их электронные адреса (только с их разрешения).
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
Несколько простых советов
Карл Броман из Школы Джона Хопкинса дает несколько советов как представлять данные плохо, а как - хорошо
Главная идея хорошего представления данных: данные должны быть собраны аккуратно и изложены ясно.
Несколько правил плохого представления данных:
•Показывать информации так мало, насколько это возможно.
•Затенять то, что вы реально хотите сказать (нежелательными графиками).
•Использовать псевдо-3D и цвет в неограниченном количестве.
•Делать круговые диаграммы (желательно в цвете и 3D).
•Использовать плохо выбранный масштаб.
•Игнорировать действительно значимые графики.
Несколько правил хорошего представления данных:
•Будьте аккуратны и излагайте ясно.
•Дайте данным говорить самим за себя.
•Представляйте столько информации, сколько возможно, НО заботьтесь о том, чтобы при этом не затенить главное.
•Наука не продается.
•Избегайте ненужных излишеств – особенно, необоснованного использования 3D.
•В таблицах, каждая цифра должна иметь значение.
How to display data badly
http://www.biostat.jhsph.edu/~kbroman
Karl W. Broman Department of Biostatistics
Johns Hopkins Bloomberg school of public health
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
Главная идея хорошего представления данных: данные должны быть собраны аккуратно и изложены ясно.
Несколько правил плохого представления данных:
•Показывать информации так мало, насколько это возможно.
•Затенять то, что вы реально хотите сказать (нежелательными графиками).
•Использовать псевдо-3D и цвет в неограниченном количестве.
•Делать круговые диаграммы (желательно в цвете и 3D).
•Использовать плохо выбранный масштаб.
•Игнорировать действительно значимые графики.
Несколько правил хорошего представления данных:
•Будьте аккуратны и излагайте ясно.
•Дайте данным говорить самим за себя.
•Представляйте столько информации, сколько возможно, НО заботьтесь о том, чтобы при этом не затенить главное.
•Наука не продается.
•Избегайте ненужных излишеств – особенно, необоснованного использования 3D.
•В таблицах, каждая цифра должна иметь значение.
How to display data badly
http://www.biostat.jhsph.edu/~kbroman
Karl W. Broman Department of Biostatistics
Johns Hopkins Bloomberg school of public health
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
Заказы (аппроксимация)
Ранее перед нами не ставили задач по аппроксимации эмпирических данных.
Но, как говорится, всегда бывает первый раз!
Работаем!
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
Но, как говорится, всегда бывает первый раз!
Работаем!
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
Чудо
Жизнь преподносит приятные сюрпризы, чему несказанно радуешься.
В череде проведенных статистических анализов особянком стоят работы по ПЛАНИРОВАНИЮ исследования (экспериментальный план). Таких работ можно по пальцам одной руки счесть. Проще собрать материал, а потом уже искать чем бы все это обработать.
Ну не принято у нас планировать исследование!
А жаль! :(
Неделю готовим план для медицинского исследования эффективности оперативных вмешательств при атеросклерозе. Интересно!!!
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
В череде проведенных статистических анализов особянком стоят работы по ПЛАНИРОВАНИЮ исследования (экспериментальный план). Таких работ можно по пальцам одной руки счесть. Проще собрать материал, а потом уже искать чем бы все это обработать.
Ну не принято у нас планировать исследование!
А жаль! :(
Неделю готовим план для медицинского исследования эффективности оперативных вмешательств при атеросклерозе. Интересно!!!
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
Пора курсовых и дипломных
Апрель-май - горячая пора в вузе! Курсовики и дипломники выходят из спячки и лихорадочно начинают готовить свои квалификационные работы. Особенно часто в это время они вспоминают о своих научных руководителях ;)
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________
Подписаться на:
Сообщения (Atom)