Математическое описание количественных признаков в биологии

Гальтон является одним из основателей биометрии - науки, которая занимается применением методов математической статистики к биологическим явлениям. Одна из задач этой дисциплины - математическое описание количественных признаков.

Рассмотрим конкретный пример. Пусть нам даны значения роста 10 учеников в группе (в см):

140, 143, 150, 151, 155, 158, 160, 162, 164, 167.

Какими величинами можно охарактеризовать рост учеников? Первая из этих величин: среднеарифметическое значение. Чтобы найти эту величину, надо сложить конкретные измерения и разделить полученную величину на число слагаемых. В нашем конкретном случае дает:

(140+143+150+151+155+158+160+162+164+167):10=155

Однако ясно, что одной этой величины недостаточно для характеристики имеющегося ряда чисел. Представим себе, что у нас была бы группа учеников, в которой все имели бы рост 155 см. Тогда среднеарифметическое значение роста этой группы было таким же, как в первом случае, т.е. 155 см. Но рассматриваемые rpyппы существенно отличаются: во второй группе все числа равны друг другу, а в первой есть числа, заметно отклоняющиеся от среднего значения. В таких случаях говорят, что в первой группе больше разброс значений, больше отклонение от среднего значения. Как же измерить величину этого отклонения от среднего? Проще всего это сделать так: из каждого конкретного значения роста вычесть среднее, т.е. найти, насколько сильно каждая величина отличается от средней. Тогда получим:

155-140 155-143 155-150 155-151

155-155 155-158 155-160

155-162 155-164 155-167.

Или: 15 12 5 4 0 -3 -5 -7 -9 -12.

Если мы попробуем сложить все эти числа, то получим ноль, так как положительные отклонения от среднего значения равны отрицательным отклонениям.

Поэтому складывают не сами эти числа, а их квадраты, затем делят полученную величину на число слагаемых. Полученный результат называют дисперсией . В нашем случае имеем:

(225+144+25+16+0+9+25+49+81+144):10 = 74,8.

Видно, что эта величина заметно отличается от величин отклонения конкретных значений роста от его среднего значения, так как мы возвели каждое отклонение в квадрат. Кроме того, дисперсия будет измеряться в кв.см как площадь, а мы хотим охарактеризовать длину. Поэтому, кроме дисперсии , для характеристики разброса часто используют величину корня квадратного из дисперсии. Этот показатель отклонения от среднего называют среднеквадратичным отклонением от среднего . В нашем случае имеем:

корень квадратный из 74,8 = 8,65 см. Это и будет среднеквадратичное отклонение.

При анализе разных количественных признаков используются также разнообразные наглядные способы их представления. Одним из таких способов является построение гистограмм. Приведем для примера слегка измененную гистограмму роста людей из работы французского математика А.Муавра "Учение о случаях", которая вышла в 1718 г. ( рис. 101 ). Муавр измерил рост 1375 женщин. Он колебался от 140 до 180 см. (В действительности, метры и сантиметры появились после Великой французской революции, но мы здесь используем привычные для нас единицы измерения). Муавр разбил женщин по росту на 16 групп. Каждая группа отличалась от другой на 2,5 см. В первую группу входили женщины с ростом от 140 до 142,5 см, во вторую - с ростом от 142,5 до 145 см и т.д. Затем он посчитал, сколько человек входило в каждую группу и построил своеобразный график, где по оси абсцисс был отложен рост, а по оси ординат - число людей, имеющих данный рост. Такой график и называется гистограммой.

Муавр также подобрал формулу для кривой, которая примерно проходит через вершины столбиков гистограммы. Эта формула называется формулой нормального распределения .

Мы привели пример простейших характеристик количественных величин. В биометрии используются и другие характеристики.

Биометрия позволяет решать ряд важных практических задач.

Ссылки: