КнигоПровод.Ru | 04.05.2024 |
|
|
Анализ таблиц сопряжённости |
Аптон Г. |
год издания — 1982, кол-во страниц — 143, тираж — 7000, язык — русский, тип обложки — мягк., масса книги — 150 гр., издательство — Финансы и статистика |
|
|
Сохранность книги — хорошая
The Analysis of Cross-tabulated Data Graham J. G. Upton Lecturer in Mathematics University of Essex
John Wiley & Sons 1978
Пер. с англ. и предисл. Ю. П. Адлера
Формат 60x90 1/16. Бумага типографская кн.-журн. Печать высокая |
ключевые слова — логарифмически-линейн, статист, эконометр, признак, фактор, многомер, планирован, регресс, байес, классификац, выборк, распределен, хи-квадрат, гипотез, оцениван, доверительн, многовход, пятифактор, мостеллеризац, политом, логлинейн, латентно-структур |
Книга представляет собой введение в анализ таблиц сопряжённости. Основным средством анализа выступает логарифмически-линейная модель. Приведённых в книге сведений достаточно, чтобы статистик, экономист, социолог, психолог мог поставить математическую задачу об обработке массива данных. Уровень изложения рассчитан на специалистов, владеющих математической символикой и терминологией.
Рекомендуется статистикам, экономистам, социологам и представителям других отраслей науки, имеющим дело с обработкой данных статистических таблиц.
Мир един и неделим. И не важно даже, кто первый произнёс эти, безусловно, правильные слова. Однако, когда речь заходит об исследовании мира, мы, как правило, беспощадно делим и максимально упрощаем его, чтобы ничто не мешало нам изучать полученный таким образом кусочек мира. Самый привычный приём упрощения — введение признаков, характерных черт, свойств, факторов, присущих или не присущих нашему объекту изучения. В этом случае можно эмпирически исследовать каждую из выбранных характеристик. И хотя мысль о том, что их достаточно большая совокупность синтезирует изучаемый объект, несколько наивна, всё же в идее совместного рассмотрения как можно большего числа признаков что-то есть. Практически же эта идея приводит к построению и исследованию таблиц со многими входами, которые и служат предметом анализа предлагаемой вниманию читателя книги Г. Аптона.
Речь в этой работе, правда, идёт не о любых многомерных таблицах (что было бы уместно в книге по многомерному статистическому анализу), а лишь о таких, в которых из-за неумения или нежелания мы фиксируем только число элементов выборки, обладающих соответствующим набором признаков. Это означает, что измерения ведутся в номинальной шкале. Конечно, часто хочется большего, но и такие данные нередко вполне достаточны и весьма важны.
Когда имеешь дело с материалом такого рода, прежде всего важно суметь ответить на следующие вопросы: как получены экспериментальные данные? какова статистическая модель ситуации? как выбраны меры и критерии? в чём цель исследования?
Первый из них, в свою очередь, можно свести к вопросам о том, чем и как мы управляем в ходе исследования. А такие формулировки характерны для планирования эксперимента. В этом смысле можно говорить о выборе самих признаков как о задаче планирования эксперимента (может быть, лучше сказать «предпланирования»).
Все подобные вопросы остались за границами книги: они требуют слишком большого проникновения в суть конкретных задач. Без внимания остались и вопросы об объёме выборки и её структуре, о том, что мы обычно называем планом выборки. Следовательно, эта книга о «пассивном» эксперименте, об обработке данных, которые уже собраны, и ничего ни прибавить, ни убавить нельзя. Понять автора вполне можно: рассмотрение проблем планирования потребовало бы резкого увеличения объёма книги.
Отвечая на второй из перечисленных выше вопросв, сразу отметим, что самая естественная модель такого рода — это модель дисперсионного анализа, которая и используется в книге почти во всех случаях. Причём автору удалось достигнуть такой ясности и лёгкости повествования, какие характерны для изложения вполне сформировавшихся научных концепций. Можно было бы, конечно, работать в рамках регрессионной или байесовской моделей (о чем автор упоминает), но это неминуемо привело бы к потере многих достоинств книги и даже изменило бы её ориентацию. Напомним, что в модели дисперсионного анализа уровни факторов считаются заданными без всяких ошибок; следовательно, мы всегда безошибочно можем отличить, скажем, любителя тенниса от поклонника крикета, а любителя бейсбола от почитателя шахмат. Статистические свойства признаются за откликом. (А если отклик — не частота, то модель репараметризуется.)
Хотя в книге упоминаются многие меры связи и независимости, а также критерии качества моделей, накопленные в процессе длительного развития прикладной статистики, центральную роль всё же играют «вариации на тему χ2-критерия». Сознавая некоторую ограниченность такой позиции, нельзя не признать, что это единственный способ консолидации того огромного разрозненного материала, который был собран к моменту начала работы над книгой.
Говоря о целях исследования, можно иметь в виду как содержательный, так и методологический аспекты. В содержательном плане таблицы сопряжённости служат важным инструментом для социолога, экономиста, демографа, реже — инженера. Потребность в них обычно возникает тогда, когда мы пытаемся понять особенности поведения выборки некоторых объектов через приписываемые этим объектам свойства. Причём желание «сопрягать» несколько свойств диктуется, как правило, тем, что поодиночке их уже испытали и потерпели фиаско. С методологической стороны вопрос сводится к тому, какую гипотезу (или гипотезы) мы собираемся проверять. Автор подробно останавливается на всех стандартных ситуациях, так что нет смысла их перечислять.
Таким образом, мы имеем дело с компактной и чёткой монографией по таблицам сопряжённости признаков (кстати, насколько нам известно, первой на русском языке), адресованной прежде всего пользователю и снабжённой многочисленными конкретными примерами.
Однако ограничиться сказанным нельзя, ибо данная книга — результат переворота в методологии анализа таблиц сопряжённости признаков, связанного с именем профессора Чикагского университета Лео Гудмена, который ввёл так называемую логарифмически-линейную модель. Его идея, оказавшаяся очень богатой, совсем проста. Если учтены все важные признаки, то естественно предположить, что частота в некоторой ячейке пропорциональна произведению частот самих признаков, образующих эту ячейку. Тогда получится модель, линейная относительно логарифма частоты. Именно такой подход позволил объединить многочисленные и многообразные результаты в единую стройную теорию. Монография Л. Гудмена (см. список дополнительной литературы в конце книги) издана в США одновременно с данной книгой. Она не Только в пять раз больше по объёму, но и адресована в основном специалистам по статистической методологии. Здесь же Г. Аптону удалось трансформировать большой и сложный материал так, что он стал вполне доступным для конкретного специалиста, знакомого с азами статистической теории…
ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ ПОСТИЖЕНИЕ ЧЕРЕЗ СОПРЯЖЕНИЕ Ю. АДЛЕР
|
ОГЛАВЛЕНИЕПредисловие к русскому изданию. Постижение через сопряжение | 3 | Предисловие | 6 | | Глава 1. Предварительные сведения из статистики | 7 | | 1.1. Введение | 7 | 1.2. Перекрёстная классификация | 8 | 1.3. Выборки, совокупности и случайные отклонения | 9 | 1.4. Нормальное распределение | 10 | 1.5. Распределение хи-квадрат | 11 | 1.6. Проверка гипотез | 12 | 1.7. Оценивание и ожидание | 12 | 1.8. Хи-квадрат критерий качества модели | 13 | | Глава 2. Связь и независимость в таблицах сопряжённости 2x2 | 16 | | 2.1. Основные свойства таблицы 2x2 | 16 | 2.2. Структура таблицы | 17 | 2.3. Проверка независимости А и В | 17 | 2.4. Точный критерий Фишера | 21 | 2.5. Меры связи | 22 | 2.6. Коэффициент связи Q Юла | 22 | 2.7. Отношение преобладаний | 23 | 2.8. Симметричные и асимметричные значения λ Гутмана | 24 | 2.9. Мера τ Гудмена и Краскала | 25 | 2.10. Меры, основанные непосредственно на X2 | 25 | 2.11. Выбор мер связи | 26 | | Глава 3. Связь и независимость в таблицах сопряжённости I X J | 26 | | 3.1. Хи-квадрат критерии для независимости | 26 | 3.2. Выявление источников отсутствия независимости | 29 | 3.3. Разбиение хи-квадрат | 30 | 3.4. Меры связи для таблиц I X J | 32 | 3.5. Измерение связи с помощью λb | 32 | 3.6. Измерение связей с помощью λa или λ | 33 | 3.7. Доверительные интервалы для λ-мер | 34 | 3.8. Меры связи, основанные на X2 | 35 | 3.9. Меры τ Гудмена и Краскала | 36 | 3.10. Меры связи для таблиц с порядковыми данными | 37 | 3.11. Мера γ Гудмена и Краскала | 37 | 3.12. Мера τ Кендэла | 38 | 3.13. Мера d Сомерса | 39 | 3.14. Сравнение мер связи | 40 | | Глава 4. Связь и независимость в многомерных таблицах | 40 | | 4.1. Введение | 40 | 4.2. Обозначения для таблицы с тремя входами | 40 | 4.3. Взаимная независимость А, В, С | 42 | 4.4. Условная независимость | 42 | 4.5. Одновременная независимость С от A и B | 43 | 4.6. Парадокс Симпсона | 44 | 4.7. Истолкование и определение взаимодействий трёх факторов | 45 | 4.8. Анализ связей в многовходовых таблицах | 46 | | Глава 5. Логарифмически-линейные модели для таблиц сопряжённости | 2x2 | 46 | | 5.1. Введение | 46 | 5.2. Назначение модели | 47 | 5.3. Виды моделей | 48 | 5.4. Насыщенная модель для таблицы 2x2 | 49 | 5.5. Оценивание параметров насыщенной модели для таблицы 2x2 | 52 | 5.6. Модель независимости для таблицы 2x2 | 53 | 5.7. Другие модели для таблиц 2x2 | 55 | 5.8. Иерархические модели | 56 | 5.9. Репараметризация модели | 57 | | Глава 6. Насыщенная модель для многомерных таблиц | 58 | | 6.1. Структура анализа многомерной таблицы | 58 | 6.2. Таблица с тремя входами. Общий случай | 58 | 6.3. Таблица 2x2x2 | 60 | 6.4. Оценивание параметров насыщенной модели | 61 | 6.5. Нормированные значения оценок параметров | 61 | 6.6. Отбор важных λ | 62 | 6.7. Многомерные таблицы | 63 | 6.8. Интерпретация модели | 65 | | Глава 7. Ненасыщенные модели для многомерных таблиц | 68 | | 7.1. Соотношения между значениями λ и условными суммами | 68 | 7.2. Примеры иерархических моделей | 69 | 7.3. Проверка значимости отдельных λ | 70 | 7.4. Анализ пятифакторной таблицы | 72 | 7.5. Обсуждение методов, используемых при «охоте» за подходящей | моделью | 77 | 7.6. Подход к ситуации с факторами и откликами | 78 | 7.7. Пример смешанной ситуации фактор/отклик | 78 | 7.8. Многостадийные модели фактор/отклик | 81 | 7.9. Пример многостадийной модели | 82 | 7.10. Обобщение результатов с помощью диаграммы связей | 83 | | Глава 8. Новые методы анализа многомерных таблиц | 84 | | 8.1. Отсеивание | 84 | 8.2. Анализ остатков | 86 | 8.3. Мультипликативная форма логарифмически-линейной модели | 88 | 8.4. Коррекция таблицы — мостеллеризация | 89 | 8.5. Другие методы проверки и оценивания | 92 | 8.6. Псевдобайесовские оценки | 94 | 8.7. Смешанные модели | 96 | | Глава 9. Многоуровневые переменные и неполные таблицы | 98 | | 9.1. Интерпретация параметров в случае многоуровневых | (политомических) переменных | 98 | 9.2. Насыщенная модель как руководство | 101 | 9.3. Разделимые неполные таблицы | 104 | 9.4. Неразделимые неполные таблицы | 105 | 9.5. Квазинезависимость и другие модели для неполных таблиц | 105 | 9.6. Разбиение полных таблиц для исключения ячейки | 108 | 9.7. Альтернативные подходы к анализу полных таблиц | 110 | 9.8. Частично категоризованные таблицы | 112 | | Глава 10. Симметрия, данные опросов и модели изменений | 112 | | 10.1. Введение | 112 | 10.2. Симметрия | 113 | 10.З. Частная однородность и квазисимметрия | 114 | 10.4. Симметрия для многомерных таблиц | 116 | 10 5. Опросные исследования | 116 | 10.6. Модель «изменчивые-преданные» | 117 | 10.7. Несрабатывание модели «изменчивые-преданные» | 119 | 10.8. Модификации логлинейных моделей | 120 | 10.9. Латентно-структурные модели | 124 | 10.10. Анализ данных опросов при отсеве опрашиваемых | 126 | 10.11. Обобщение модели «изменчивые-преданные» и смежные вопросы | 127 | | Приложения | 128 | Библиография | 130 | Дополнительная литература | 135 | Указатель перевода терминов | 136 |
|
Книги на ту же тему- Анализ данных на компьютере: учебное пособие. — 4-е изд., перераб., Тюрин Ю. Н., Макаров А. А., 2008
- Основы прикладной статистики, Мелник М., 1983
- Введение в теорию вероятностей и математическую статистику, Арлей Н., Бух К. Р., 1951
- Планирование эксперимента при поиске оптимальных условий. — 2-е изд. перераб. и доп., Адлер Ю. П., Маркова Е. В., Грановский Ю. В., 1976
- Теория вероятностей и математическая статистика. Учеб. пособие для втузов. — 5-е изд., перераб. и доп., Гмурман В. Е., 1977
- Теория вероятностей. Математическая статистика, Бочаров П. П., Печинкин А. В., 1998
- Математическая статистика в технологии машиностроения. — 2-е изд., перераб. и доп., Солонин И. С., 1972
- Математические методы в социальных науках, Лазарсфельд П., Генри Н., ред., 1973
- Историко-социальные исследования, ЭВМ и математика, Устинов В. А., Фелингер А. Ф., 1973
- Количественные методы в социологии, Шубкин В. Н., сост., 1966
- Методика и техника статистической обработки первичной социологической информации, Осипов Г. В., ред., 1968
- Эконометрика. Начальный курс: Учебник. — 7-е изд., испр., Магнус Я. Р., Катышев П. К., Пересецкий А. А., 2005
- Развитие социально-экономической статистики: избранные труды, Ряузов Н. Н., 2009
- Да, нет или может быть…: Рассказы о статистической теории управления и эксперимента, Хургин Я. И., 1977
- Статистика рассказывает, Володарский Л. М., 1982
- Введение в эконометрику, Доугерти К., 1999
- Методы обработки экспериментальных данных. — 2-е изд., Уорсинг А., Геффнер Д., 1953
- Регрессионный анализ в экспериментальной физике, Живописцев Ф. А., Иванов В. А., 1995
- Основы теории ошибок для астрономов и физиков, Агекян Т. А., 1968
- Статистика для физиков. Лекции по теории вероятностей и элементарной статистике, Худсон Д., 1967
- Статистический анализ экспериментальных данных, Протасов К. В., 2005
- Метод двухступенчатого статистического анализа и его приложения в технике, Синдлер Ю. Б., 1973
- Прикладной многомерный статистический анализ, 1978
- Статистические методы разграничения геологических объектов по комплексу признаков, Родионов Д. А., 1968
- Асимптотические методы в математической статистике, Барндорф-Нильсен О., Кокс Д., 1999
- Знаковый статистический анализ линейных моделей, Болдин М. В., Симонова Г. И., Тюрин Ю. Н., 1997
- Статистический анализ временных рядов, Андерсон Т., 1976
- Временные ряды. Обработка данных и теория, Бриллинджер Д. Р., 1980
- Иерархические структуры. Модель процессов проектирования и планирования, Мангейм М. Л., 1970
|
|
|
© 1913—2013 КнигоПровод.Ru | http://knigoprovod.com |
|