Авторизация

Подписка

Если Вы хотите еженедельно получать по почте подборку новых материалов сайта "Генофонд.рф", напишите нам на адрес info@генофонд.рф

Свежие комментарии

Генофонд.рф
Синтез наук об этногенезе
Генофонд.рф / Словарик / Метод главных компонент

Метод главных компонент

Метод главных компонент (Рrincipal component analysis (PCA)) – в многомерной статистике один из основных способов уменьшить размерность данных, потеряв при этом наименьшее количество информации. Метод широко используется в ряде наук, в том числе в популяционной генетике, для визуализации больших массивов данных. Вместо N равноправных исходных признаков вычисляются N новых признаков, называемых главными компонентами, причем первая главная компонента в наибольшей степени скоррелирована со всеми исходными признаками (описывает наибольшую часть их изменчивости), вторая главная компонента описывает вторую по значимости долю изменчивости и при этом характеризуется нулевой корреляцией с первой компонентой, третья главная компонента описывает третью по величине долю изменчивости и характеризуются нулевой корреляцией с первыми двумя компонентами и так далее.

Даже если исходных признаков было несколько десятков (или даже миллионов), обычно можно ограничиться рассмотрением первых двух-трех главных компонент. В результате применения метода главных компонент из таблицы, где каждая популяция охарактеризована по большому числу признаков, исследователь получает таблицу, в которой каждая популяция охарактеризована всего по двум-трем важным признакам, а эту таблицу легко отобразить в виде графика, на котором каждая популяция представлена точкой, а генетически близкие популяции (характеризующиеся близкими значениями главных компонент) формируют кластеры.

Другие слова

А • Б • В • Г • Д • Е • Ж • З • И • К • Л • М • Н • О
П • Р • С • Т • У • Ф • Х • Ц • Ч • Ш • Э • Ю • Я
Яндекс.Метрика © Генофонд.рф, 2015