Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Управление большими системами. УБС-2017

.pdf
Скачиваний:
2
Добавлен:
12.11.2023
Размер:
17.48 Mб
Скачать
xi (s) = 1 n sij ,i N n j=1

Управление организационными и социально-экономическими системами

τ

 

xτj1i ,

если siiτ

+ xτj1i < R

 

 

 

 

 

 

 

 

 

 

j N \{i}

 

 

 

 

 

 

 

 

 

 

 

sji

=

 

 

1

 

 

 

 

 

 

 

xτj1i R

 

xτj1i

 

 

 

Ai ,

если siiτ +

 

n

1

 

 

 

 

 

 

 

 

j N \{i}

 

 

 

 

 

 

 

 

 

 

 

 

Здесь

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xji

=

 

1

 

sjk

,

 

 

 

n

 

 

 

 

 

 

 

 

 

 

1k N \{i}

 

.

Ai = sii + xj i R j N \{i}

В соответствии с процедурой π(s) = {x1(s), …, xn(s)} Центр распределяет ресурс, усредняя заявки всех игроков,

.

Трансферы игроков рассчитываются по формуле

ti (s) = pi (s) 1 n pj (s), i N, n j=1

n

где pi (s) = β (xj (s) sij )2 , i N – штраф за разногласие игро-

j=1

ков, коэффициент β ≥ 0 – характеристика силы штрафа. Выигрыш агента зависят от величины штрафа и на каждой

итерации определяется по формуле

ϕi (s) = ui (π (s)) ti (s). .

Игра продолжается несколько шагов (количество итераций более 1).

2.2. ПРИМЕР ИГРЫ РАСПРЕДЕЛЕНИЯ РЕСУРСА

Игра по распределению ограниченного ресурса модифицированным механизмом Гровса–Лейдярда проводилась в разных по полу, возрасту, уровню образования и прочим характеристикам группах. Данные игр предоставлены авторами работы [3].

Пример фрагмента игры приведен в табл. 1, где s1, s2, s3 – заявки первого, второго и третьего игроков соответственно; х1,

147

171

Управление большими системами. Выпуск XX

х2, х3 – ресурс, получаемый игроками; р1, р2, р3 – штрафы, назначаемые игрокам, ϕ1, ϕ2, ϕ3 – выигрыши, первого, второго

итретьего игроков соответственно.

Вигре с данным механизмом нет явных рекомендаций. Основные правила:

– не делать резких изменений в заявках,

– большая прибыль может быть компенсирована большим штрафом за несоответствие заявки игрока величине полученного ресурса.

Таблица 1. Данные игры по распределению ограниченного ресурса механизмом Гровса–Лейдярда

 

1

2

3

4

5

6

7

8

9

 

 

 

 

 

 

 

 

 

 

s 1

49,00

49,00

47,00

25,00

24,00

22,00

62,00

21,00

21,00

 

 

 

 

 

 

 

 

 

 

s 2

41,00

70,00

60,00

50,00

80,00

100,00

80,00

55,00

55,00

s 3

25,00

35,00

35,00

64,00

60,00

60,00

60,00

45,00

55,00

 

 

 

 

 

 

 

 

 

 

x1

49,00

42,50

42,25

28,56

16,46

11,41

28,21

24,80

18,78

 

 

 

 

 

 

 

 

 

 

x2

41,00

49,00

48,38

43,36

52,12

62,77

51,67

52,17

50,17

x3

25,00

23,50

24,38

38,11

44,30

40,83

35,12

38,03

44,14

 

 

 

 

 

 

 

 

 

 

p1

0,00

–0,13

–0,06

–0,17

–0,22

–0,48

0,19

–0,03

–0,01

 

 

 

 

 

 

 

 

 

 

p2

0,00

0,16

0,01

–0,03

0,25

0,46

0,03

0,04

–0,03

 

 

 

 

 

 

 

 

 

 

p3

0,00

–0,03

0,05

0,20

–0,04

0,02

–0,22

–0,01

0,04

ϕ1

7,07

6,72

6,64

5,61

4,40

4,00

5,22

5,11

4,46

ϕ2

7,07

7,46

7,56

7,26

7,56

8,01

7,76

7,78

7,72

ϕ3

7,07

6,99

6,98

7,75

8,36

8,10

7,97

7,95

8,28

Первые восемь шагов примера характеризуются скачкообразной динамикой в величине заявок агентов (рис. 1) и величине, полученной ими прибыли (рис. 2).

На первом шаге каждый игрок сделал заявку, соответствующую равновесной. На втором шаге первый игрок применил стратегию (модель поведения) «неизменная заявка», второй игрок сильно увеличил заявку, третий увеличил заявку, но не так сильно. В результате количество полученного ресурса для первого и третьего игроков уменьшилось, для второго – увеличилось (рис. 3).

148

172

Управление организационными и социально-экономическими системами

Рис. 1. Динамика заявок игроков

Рис. 2. Динамика выигрышей игроков

Рис. 3. Динамика ресурсов, полученных игроками

Первому и третьему игрокам были назначены штрафы, второй получил дополнительный доход (рис. 4).

Рис. 4. Динамика заявок игроков

149

173

Управление большими системами. Выпуск XX

Витоге выигрыш первого и третьего игроков уменьшился,

увторого – увеличился.

На третьем шаге первый и второй игроки уменьшили свои заявки (немного – первый игрок, сильно – второй), третий игрок оставил заявку без изменений. Раздача ресурса оказалась немного меньше для первого и второго игроков и немного больше, для третьегоигрока, чемнавторомшаге. Прибыльприэтомдлявторого игрокаувеличиласьиуменьшиласьдляпервогоитретьегоигроков.

Неизменность заявок на втором, девятом и десятом шагах привела к уменьшению прибыли.

Небольшое уменьшение изменение заявки первого игрока на третьем, пятом и шестом шагах привело к уменьшению выигрыша первого игрока.

Увеличение заявки первого игрока в два-три раза на седьмом шаге, второго игрока на втором, третьем, пятом и шестом шагах, третьего игрока на четвёртом и девятом шагах привело

кувеличению прибыли игроков.

Сдесятого по тридцать седьмой шаг заявки изменяются незначительно и так же незначительно меняются выигрыши игроков. Таким образом, игра пришла к равновесию.

Известные модели поведения, применённые к этим данным, не полностью описывают поведение игроков.

Таким образом, учитывая наличие определённых закономерностей между поведением игроков и полученными результатами, описывающая их модель поведения определяет необходимость разработки новой модели поведения.

3. Модель поведения игроков

3.1. АЛГОРИТМ НЕЧЕТКОГО ВЫВОДА

Модель поведения игроков в описанной выше игре построим на основе нечеткого логического вывода. Перечислим основные его этапы.

1.Формирование базы правил нечеткого вывода.

2.Фаззификация переменных (описание их функций принадлежности).

3.Агрегирование подусловий (определяется степень истинности условий по каждому правилу базы знаний).

150

174

Управление организационными и социально-экономическими системами

4.Активизация заключений (определяется степень истинности заключения по каждому правилу базы знаний).

5.Аккумуляция заключений (объединение степеней истинности заключений всех правил базы знаний).

6.Дефаззификация (установление конкретного числового значения выходной переменной).

Пусть входные переменные описывают динамику изменения полученного игроком ресурса, динамику изменения полученного ресурса конкурентами, динамику изменения прибыли (выигрыша) игрока, динамику изменения прибыли (выигрыша) конкурентов. Выходная переменная рекомендует действие игроку (повысит, понизить или не изменять заявку) на следующем шаге.

Построив функции принадлежности и сформулировав базу знаний, можно будет не только прогнозировать действие игрока, но давать ему количественную характеристику – на сколько повысить (понизить) свою заявку.

3.2.ФОРМИРОВАНИЕ БАЗЫ ПРАВИЛ

Базу правил построим, проведя статистическую обработку результатов проведенных игр с тремя участниками.

Используя данные двух последовательных (k – 1)-го и k-го шагов, определим динамики изменения распределения ресурсаxi и выигрышей ϕi i-го игрока, а также динамику изменения

обстановки ( xi – изменение распределения ресурса игрокам j N/{i}, ϕi – изменение выигрышей игроков j N/{i}). Выясним, какую заявку сделал i-й игрок на (k + 1)-м шаге, оценим ее изменение si по сравнению с шагом k.

Поскольку динамика изменения может описываться лишь тремя значениями {, , 0}, получим не более 37= 2187 комбинаций, однако, учитывая ограниченность распределяемого ресурса, это число существенно снижается. Действительно, если для i-го игрока распределение ресурса увеличилось xi ≠↑ , то

для оставшихся двух игроков значение xi ≠↑↑ и xi 00 .

Выигрыши же с учетом трансфера могут возрастать даже при уменьшении количества распределенного ресурса.

151

175

Управление большими системами. Выпуск XX

В табл. 2 приведены возможные варианты значений, описывающих динамику изменения распределения ресурса, выигрышей и заявок в игре для трех участников.

Таким образом, начиная с 3-го шага игры, для каждого игрока можем зафиксировать точку, описывающую одну из 972 сло- жившихся ситуаций: ( xi , xi , ϕi , ϕi , si ).

Таблица2. Динамикаизмененийраспределенияресурса, выигрышей изаявок

Параметр

 

Вариантыизменений

 

xi

 

0

 

 

 

↑↓,

 

↑↑, ↑↓, 0,

↑↓,

xi

↓↑, ↓↓, 0,

 

↓↑,

 

↓↑

 

 

 

0

 

0

 

 

 

 

 

 

ϕi

, , 0

 

, , 0

, , 0

 

 

 

↑↑, ↑↓, 0,

 

↑↑, ↑↓, 0,

↑↑, ↑↓, 0,

 

ϕi

 

↓↑, ↓↓, 0,

 

↓↑, ↓↓, 0,

↓↑, ↓↓, 0,

 

 

 

0, 0, 00

 

0, 0, 00

0, 0, 00

 

si

, , 0

 

, , 0

, , 0

С целью выявления наиболее часто встречающихся ситуаций была проведена кластеризация по данным 23 игр.

Врезультате было выделено 5 наиболее значимых кластеров, каждый из которых включает более 35 элементов при максимальном количестве элементов в кластере – 60.

На рис. 5 приведены результаты кластеризации. По вертикали указано число элементов в кластере, по горизонтальной оси расположены кластеры в порядке возрастания количества элементов.

Втабл. 3 приведено подробное описание выделенных кластеров.

Всоответствии с полученными данными были сформулированы правила базы знаний.

152

176

Управление организационными и социально-экономическими системами

Рис. 5. Результаты кластеризации Таблица 3. Описание кластеров

 

 

 

Параметры

 

 

 

Кол-во

кластера

xi

 

 

 

ϕi

 

 

 

si

элементов

xi

ϕi

1

 

↓↑

 

 

↓↑

 

0

60

2

 

↓↓

 

 

↓↓

 

45

3

 

↑↑

 

 

↑↑

 

39

4

 

↓↑

 

 

↓↑

 

0

37

5

 

↑↓

 

 

↑↓

 

36

3.3.ПОСТРОЕНИЕ ФУНКЦИЙ ПРИНАДЛЕЖНОСТИ

Лингвистические переменные (ЛП), участвующие в нечетком

логическомвыводе, иихтерм-множестваприведенывтабл. 4.

Таблица. 4. Описание лингвистических переменных

ИмяЛП

Обозна-

Терм-множество

 

чение

 

 

 

 

«объемраспределен-

Xi

{повысился, понизился, неизме-

 

ногоресурсаигрока»

 

нился}

 

«объемраспределен-

X–i

{повысилсяувсех, понизился

 

ногоресурсаконку-

 

увсех, повысилсяуодногоипо-

 

рентов»

 

низилсяудругого}

 

«объемвыигрышаиг-

Фi

{повысился, понизился, неизме-

 

рока»

 

нился}

 

«объемвыигрыша

Ф–i

{повысилсяувсех, понизился

 

конкурентов»

 

увсех, повысилсяуодногоипо-

 

 

 

низилсяудругого}

 

«объемзаявкиигрока

Si

{повысить, понизить, не изме-

 

наресурс»

 

нять}

 

 

 

153

 

 

177

Управление большими системами. Выпуск XX

Функции принадлежности составлены экспертным образом и носят дробно-линейный характер.

4. Результаты и выводы

На основе статистической информации по проведённым играм по распределению ограниченного ресурса модифицированным механизмом Гровса–Лейдярда [3] выявлены возможные параметры оценки окружающей среды и сформировано множество возможных обстановок окружающей среды.

Проведена кластеризация имеющихся данных, проведено ранжирование полученных результатов по частоте попадания в соответствующую группу (кластер).

Выбраны кластеры с наибольшей частотой попадания, и на их основе сформулированы правила поведения игроков.

Процесс построения модели носит универсальный характер и может быть реализован для произвольных механизмов распределения. Проверка эффективности разработанной модели составляет отдельную самостоятельную задачу и является темой дальнейших исследований авторов.

Работа выполнена при поддержке гранта РФФИ № 17-07-01550 А.

Литература

1.Большие системы: Моделирование организационных меха-

низмов / В.Н. БУРКОВ, Б. ДАНЕВ, А.К. ЕНАЛЕЕВ [И ДР.]. –

М.: Наука, 1989.

2.ЗАХАРОВ А.В. Теория игр в общественных науках: учеб-

ник для вузов / Нац. исслед. ун-т «Высшая школа экономики». – М.: Изд. дом высш. школы экономики, 2015. – (УчебникиВысшейшколыэкономики). – 304 с. – С. 22.

3.КОРГИН Н.А., КОРЕПАНОВ В.О. Решение задачи эффек-

тивного распределения ресурсов на основе механизма Гровса– Лейдярда при трансферабельной полезности // Управление большимисистемами: сб. трудов. – 2013. – №46. – С. 216–266.

4.Модель системы поддержки принятия решения с использованием нечёткой логики в деловых играх распределения ресурсов с нетрансферабельной полезностью / М.В. ДОДО-

154

178

Управление организационными и социально-экономическими системами

НОВ, Н.Л. ДОДОНОВА, О.А. КУЗНЕЦОВА, А.А. ЕЛИСТРАТОВ // Управление большими системами: XIII Всерос. школа-конф. молод. ученых; 5–10 сентября 2016 г. – М.: Изд-во ИПУ РАН, 2016.

5.ARIFOVIC J., LEDYARD J. A Behavioral Model for Mechanism Design: Individual Evolutionary Learning // Journal of Economic Behavior & Organization. – 2010. – December 23.

6.CAMERER C., TECK HUA HO. Experience-weighted Attraction Learning in Normal Form Games // Econometrica. – July 1999. – P. 827–874.

7.FOX C.R., TVERSKY A. A Belief-Based Account of Decision Under Uncertainty // Management Science. – 1998.

8.MOULIN H. Honorary papers “Fair Division in the age of Internet” // National Research University Higher School of Economics, XVII April International Academic Conference on Economic and Social Development, 19–22 April 2016.

9.SUTTON R.S., BARTO A.G. Reinforcement learning: an introduction.

BEHAVIOR MODEL IN BUSINESS GAMES

WITH THE MODIFIED MECHANISM

OF HROSES-LAYDYARDA FOR LIMITED

RESOURCES ALLOCATION

Olga Kuznetsova, Samara University, Samara, Cand.Sc., assistant professor, (Samara, Moscow Highway 34, 8(846)267-44-96, olga_5@list.ru). Natalia Dodonova, Samara University, Samara, Cand.Sc., assistant professor, (ndodonova@bk.ru).

Vadim Glukhov, Samara University, Samara, student, (headlaw96@ gmail.com).

Abstract: The article describes the process of constructing an agent behavior model in a game with a modified Groves-Leydard mechanism for the limited resource allocation. The model is built on the fuzzy logic basis and the fuzzy inference rules are formed on the basis of clustering the data of a large number of games played.

Keywords: resource allocation mechanisms, behavior models, fuzzy logic, clustering.

155

179

Управление большими системами. Выпуск XX

УДК 004.896 + 004.023 ББК 32.965.7

УЧЕТ ПРИОРИТЕТОВ СТУДЕНТОВ ПРИ УПРАВЛЕНИИ ИНДИВИДУАЛЬНЫМИ

УЧЕБНЫМИ ПЛАНАМИ СТУДЕНТОВ В УСЛОВИЯХ СЕТЕВОГО ВЗАИМОДЕЙСТВИЯ ВУЗОВ

Чугунов А.П.1

(Пермский национальный исследовательский политехнический университет, Пермь)

При построении индивидуальных учебных планов студентов, обучающихся по сетевой образовательной программе, часто возникает ситуация, когда удовлетворить желания всех студентов невозможно. В этом случае лицо, принимающее решения, осуществляет выбор итогового решения. Данная статья посвящена критериям такого выбора, одним из которых может быть учет приоритетов студентов, формируемый на основе его социального статуса и достижений.

Ключевые слова: индивидуальные учебные планы, сетевая образовательная программа, социальные категории студентов.

1. Введение

Федеральный закон от 29 декабря 2012 г. № 273-ФЗ «Об образовании в Российской Федерации» устанавливает возможность реализации образовательных программ в сетевой форме.

В законе под сетевой формой реализации образовательных программ понимается организация обучения с использованием ресурсов нескольких организаций, осуществляющих образовательную деятельность, в том числе иностранных, а также при необходимости с использованием ресурсов иных организаций [2].

1 Александр Петрович Чугунов, аспирант (ap.chugunov@gmail.com).

156

180