Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 3000242.doc
Скачиваний:
12
Добавлен:
30.04.2022
Размер:
1.13 Mб
Скачать

1.8.4. Метод кластеризации

Кластеризация – это разбиение по принципу схожести элементов некоторого множества (объекты, данные и др.) на группы (кластеры от англ. cluster).

Цель кластеризации – построить оптимальное разбиение объектов на группы таким образом, чтобы внутригрупповые отличия были минимальными, а межгрупповые – максимальными (чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались).

Оценка продукции методом кластеризации предполагает разбиение (разделение) аналогов на три уровня качества: высший, средний и низший.

При кластеризации разбиение объектов на группы производится путем попарного сравнения (сопоставления) аналогов продукции по единичным или нормированным показателям качества. При этом учитывается, какой это показатель: позитивный или негативный.

Результаты сравнения аналогов сводятся в таблицу, где используются следующие обозначения:

- знак «=» показывает, что при попарном сопоставлении двух аналогов значение первого показателя выше у одного аналога, а второе – у другого;

- цифра «1» показывает, что значения обоих показателей у аналога, соответствующего строке таблицы больше, чем у аналога, соответствующего столбцу, или один равен, а другой больше;

- цифра «0» означает, что один аналог уступает другому по обоим показателям.

Аналоги, которым соответствует строка, содержащая «0» и «=» относятся к низшему уровню, аналоги, которым соответствует срока, содержащая «1» и «=» относятся к высшему уровню, остальные аналоги относятся к среднему уровню.

В последнем столбце таблицы факт отнесения аналога к высшему, среднему или низшему уровню отражается соответственно буквами В, С или Н.

Оценка уровня качества продукции методом кластеризации рассмотрена на примере задачи 1.

Задача №1

Провести кластеризацию пяти объектов (аналогов), характеризующихся двумя позитивными нормированными показателями качества Х1 и Х2 (табл. 2).

Таблица 2

ПК

Аналоги

1

2

3

4

5

Х1

0,73

0,71

0,58

0,33

0,65

Х2

0,25

0,63

0,10

0,61

0,23

Решение

Результаты сопоставления аналогов сведены в табл. 3

Таблица 3

1

2

3

4

5

Уровень

1

=

1

=

1

В

2

=

1

1

1

В

3

0

0

=

0

Н

4

=

0

=

=

Н

5

0

0

1

=

С

Вывод: Аналоги 1, 2 отнесены к высшему уровню, т.к. каждый из них не уступает ни одному из остальных по совокупности оценочных показателей. Аналоги 3, 4 относятся к низшему уровню, т.к. каждый из них не превосходит ни один из остальных по совокупности оценочных показателей; аналог 5 относится к среднему уровню.

Разница между кластеризацией и классификацией заключается в том, что кластеризация разбивает множество объектов на группы, которые определяются только её результатами, а классификация относит каждый объект к одной из заранее определенных групп.

Кластеризация имеет множество практических применений:

- оценка уровней качества продукции (в квалиметрии);

- анализ данных (в информатике);

- группировка и распознавание объектов;

- извлечение и поиск информации (например, поиск книг в библиотеке).