Издательство «Символ-Плюс». 199034, Санкт-Петербург, 16 линия, 7,
тел. (812) 3245353, www.symbol.ru. Лицензия ЛП N 000054 от 25.12.98.
Налоговая льгота – общероссийский классификатор продукции
ОК 005 93, том 2; 953000 - книги и брошюры.
Подписано в печать 30.06.2008. Формат 70х100 1/16. Печать офсетная.
Объем 23 печ. л. Тираж 2000 экз. Заказ N
Отпечатано с готовых диапозитивов в ГУП «Типография «Наука»
199034, Санкт-Петербург, 9 линия, 12.
1. Введение в коллективный разум ........................................... 19
Что такое коллективный разум .................................................... 20
Что такое машинное обучение ..................................................... 22
Ограничения машинного обучения ............................................... 23
Примеры из реальной жизни ....................................................... 23
Другие применения обучающих алгоритмов .................................. 24
2. Выработка рекомендаций ..................................................... 26
Коллаборативная фильтрация ..................................................... 27
Сбор информации о предпочтениях .............................................. 27
Отыскание похожих пользователей .............................................. 29
Рекомендование предметов ......................................................... 35
Подбор предметов ...................................................................... 37
Построение рекомендателя ссылок с помощью API сайта del.icio.us ... 39
Фильтрация по схожести образцов ............................................... 43
Использование набора данных MovieLens ...................................... 46
Сравнение методов фильтрации по схожести пользователей
и по схожести образцов ............................................................... 48
Упражнения ............................................................................. 49
3. Обнаружение групп ............................................................... 50
Обучение с учителем и без него .................................................... 51
Векторы слов............................................................................. 51
Иерархическая кластеризация .................................................... 54
Рисование дендрограммы ............................................................ 60
Кластеризация столбцов ............................................................. 63
6
Оглавление
Кластеризация методом K-средних............................................... 64
Кластеры предпочтений .............................................................. 67
Просмотр данных на двумерной плоскости .................................... 71
Что еще можно подвергнуть кластеризации ................................... 75
Упражнения ............................................................................. 76
4. Поиск и ранжирование........................................................... 77
Что такое поисковая машина ....................................................... 77
Простой паук ............................................................................ 79
Построение индекса ................................................................... 82
Запросы.................................................................................... 86
Ранжирование по содержимому ................................................... 88
Использование внешних ссылок на сайт ........................................ 93
Обучение на основе действий пользователя .................................... 99
Упражнения ........................................................................... 109
Последние комментарии
3 минут 26 секунд назад
2 часов 37 минут назад
3 часов 5 минут назад
3 часов 12 минут назад
4 часов 47 минут назад
6 часов 15 минут назад