<< Предыдущая

стр. 11
(из 26 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

Ф17
При a возникает b
Ф22

b может развиваться при a

Ф18
a может привести к b
Ф23

b может начаться с a

Ф19
a может развиваться в b





Этот список не является исчерпывающим, однако дает представление о тех когнитивных структурах, которые необходимо представлять и обрабатывать в базе знаний.
Каждая из этих форм может иметь различный смысл; уточнение смысла можно получить при рассмотрении «прямого» сообщения с «обращенным». Иными словами, если для некоторых фиксированных а или Р справедливо сообщение формы Ф10, то необходимо попытаться установить, какое из сообщений Ф1 — Ф23 справедливо при замене a на b, b наa. Так, для сообщения «Гром наблюдается при грозе» справедливо «обращенное» сообщение «Гроза сопровождается громом», а для сообщения «Воспалительный процесс может наблюдаться при повышенной температуре» справедливо сообщение «Повышенная температура характерна для воспалительного процесса». Таким образом, смысл сообщений уточняется построением «конъюнкций» форм Ф1 — Ф23. Такие «конъюнкции» форм сообщений будут называться типами сообщений. Возможные типы сообщений приведены в табл. 4.7.
Таблица 4.7.
Типы сообщений

Тип
Сообщение
Т1
Т2
Т3
Т4
Т5
Т6
Т7
Т8
T9
Т10
Т11

Т12
Т13
a есть проявление b, и b может сопровождать a
a есть проявление b, и b сопровождается a
a может увеличивать возможность b, и b увеличивает возможность a
a может сопровождаться b, и b может быть проявлением a
a сопровождается b, и b может быть проявлением a
a есть проявление b, и b есть проявление a
a может увеличивать возможность b, и b может увеличивать возможность a
a может протекать с b и b может протекать с a
a увеличивает возможность Р, и р увеличивать возможность a
a сопровождаетсяb, и b может сопровождает a
a сопровождается b, и b сопровождаться a
a исключает b,. и b исключает a
a приводит к b





Продолэение табл. 4.7.


Тип
Сообщение
Т14
a может привести к b
Т15
a увеличивает возможность развития b
Т16
a может увеличить возможность развития b ,
Т17
a исключает возможность развития b

С каждым типом сообщения из табл. 4.7 связывается формальная конструкция базы знаний, то есть бинарное отношение на множестве объектов (событий). Эти конструкции можно проиллюстрировать следующим образом: если каждый объект (событие) представить в виде «двухмерного» множества, по первому измерению которого можно откладывать атрибуты этого объекта, а по второму — множества значений соответствующих атрибутов, то каждый объект представляется в виде фигуры:




Если считать множества всех атрибутов равновеликими, то можно рисовать прямоугольники.
Тогда типу сообщения Т, можно поставить в соответствие диаграмму (пересечение a и b всюду далее заштриховано).



В качестве примера приведем интерпретации некоторых диаграмм. Так, диаграмму, соответствующую сообщению типа Т3, можно интерпретировать следующим образом: для всякого примера объекта b найдутся такие примеры объекта a, в которых равны совпадающие имена и значения атрибутов. Для остальных типов сообщений получим диаграммы, представленные в табл. 4.8.









Таблица 4.8.
Диаграммы для различных типов сообщений




Для сообщения типа Т8: для всякого имени атрибута примера объекта а найдется совпадающее с ним имя атрибута из примера объекта b, и наоборот; при этом соответствующие значения атрибутов равны. Найдутся такие примеры объекта a, в которых равны совпадающие имена и значения атрибутов.
Каждой из изображенных диаграмм можно дать такую теоретико-множественную интерпретацию, связав с каждым из типов сообщений Ti некоторое бинарное отношение Rk примеров объектов (при k = i).
Способ представления с определенными так отношениями называется неоднородной семантической сетью.
В реализации базы знаний основными элементами структур данных являются элементы «вершина», «элемент кортежа», «атрибут», «цепь», «стрелка». Элемент «вершина» соответствует объекту (событию), он содержит имя, списки входных и выходных «стрелок» и список типа «элемент кортежа». Список «элементов кортежа» соответствует совокупности атрибутов события.
Для обеспечения простого способа определения указателя «вершины» существуют элементы типа «цепь». Элемент типа «цепь» содержит указатель на «вершину» и указатель на следующий элемент типа «цепь». Указатель на первый элемент списка «цепь» входит в описание элемента типа «атрибут». «Атрибут» характеризуется также именем, множеством значений и единицей измерения.
Отношения на множестве объектов реализованы в элементах типа «стрелка». Каждый такой элемент содержит имя, сорт, вес, тип веса, указатель на «вершину» и указатель на следующий элемент типа «стрелка». Отношения на двух объектах описываются парой элементов типа «стрелка», один из которых входит в список входящих стрелок одного объекта, другой — в список входящих стрелок другого объекта.
Процедурная компонента системы содержит функции создания структур данных, поддержки корректности базы знаний, наследования свойств и ряд других функций. Для обеспечения поиска по именам элементов типа «вершина» и «атрибут» в системе реализовано В-дерево. Доступ ко всем элементам базы осуществляется через виртуальную память. Каждый элемент имеет внутренний идентификатор, по значению которого однозначно определяется его размещение в оперативной или внешней памяти. Для работы с объектами, отсутствующими в оперативной памяти, осуществляется их динамический перенос из внешней памяти в оперативную. Это позволяет системе работать на компьютере с ограниченным объемом оперативной памяти.

Прямое приобретение знаний в системе SIMER
Для выявления структурных знаний о предметной области используются стратегии разбиения на ступени и репертуарных решеток. Подробнее о репертуарных решетках см. параграф 5.2.
Стратегия разбиения на ступени направлена на выявление структурных и классификационных свойств событий (понятий, объектов) области и таксонометри-ческой структуры событий предметной области.
Стратегия разбиения на ступени реализуется в одном из двух сценариев, который выбирается экспертом
1. «Имя — свойство».
2. «Множество имен — свойство».


В результате выполнения шага 7 один из элементов базиса свойств связывается с описываемым событием (с указанием подмножества области значений элемента базиса, характеризующего описываемое событие).


Стратегия репертуарных решеток направлена на преодоление когнитивной защиты эксперта. Механизм преодоления основан на выявлении его личностных конструктов. Каждый конструкт описывается некоторой совокупностью шкал, а каждая шкала образуется оппозицией свойств.
Наиболее эффективный способ выявления противоположных свойств — предъявление эксперту триад семантически связанных событий с предложением назвать свойство, отличающее одно событие от двух других [Kelly, 1955]. На следующем шаге эксперту предлагается назвать противоположное свойство. Таким способом выявляются элементы множества личностных психологических конструктов конкретного эксперта.
С другой стороны, свойства, различающие события, — это те свойства, которые влияют на формирование решения. Так как при этом не ставится задача выявления когнитивной организации индивидуального сознания эксперта, то описанная процедура используется для формирования базиса свойств области, а не для построения личностных конструктов. Пополнение базиса свойств области осуществляется путем повторения этой процедуры с другими триадами.

Пример 4.9
Например, эксперту в области представления знаний предъявляется триада понятий, описывающих способы представления: семантические сети, фреймьСсистемы продукций. Эксперту предлагается ответить на следующие вопросы:
Какой из указанных способов представления отличается от двух других?
системы продукций;
Какое свойство отличает системы продукций от семантических сетей и фреймов? легкость описания динамики;
Назовите противоположное свойство свойству «легкость описания динамики»? трудность описания динамики;
Дайте имя свойству, имеющему значения «легкость описания динамики» и «трудность описания динамики»?
возможность описания динамики.
В результате формируется шкала с именем «возможность описания динамики» и со значением «легкость описания динамики» для объекта «системы продукций»; «трудность описания динамики» для объектов «семантические сети» и «фреймы».
Предлагая эксперту аналогичные вопросы об отличии семантических сетей от систем продукций и фреймов, можно выявить и другие свойства базиса области.

Еще один пример — выявление каузальных знаний о предметной области. К каузальным знаниям о предметной области в соответствии с работой [Поспелов, 1986] относятся:
• связи между следствиями и необходимыми и достаточными причинами;
• связи между следствиями и достаточными причинами;
• связи между следствиями и необходимыми со-причинами; связи между следствиями и возможными со-причинами.
Будем понимать каузальные знания несколько шире, включив в рассмотрение, кроме связей событий настоящего с будущим и событий прошлого с настоящим, и связи между событиями настоящего. В соответствии с этим отнесем к каузальным знаниям все типы сообщений из табл. 4.6.
Тогда задача выявления каузальных знаний сведется к установлениюхоответ-ствия между множеством типов сообщений и множеством отношений R,—R17, то есть к поиску отображения Т в R. Для поиска этого отображения используется стратегия выявления сходства [Осипов, 1989]. Она основана на выявлении в интерактивном режиме алгебраических свойств сообщений Т; (таких как симметричность — ассимметричность, рефлексивность — иррефлексивность и других) и появлении на основании этого гипотез о принадлежности сообщений тем или иным отношениям Rk (именно эти свойства оказываются нужными при работе механизма рассуждений).

Пример 4.10
Например, относительно двух событий: «рост заработной платы» и «повышение уровня жизни» эксперт сообщил, что «рост заработной платы» обычно сопровождается «повышением уровня жизни». Тогда возникают вопросы:
а) повышение уровня жизни всегда сопровождается ростом заработной платы?
б) повышение уровня жизни обычно сопровождается ростом заработной платы?
в) повышение уровня жизни может сопровождаться ростом заработной платы?
Ответ эксперта а) будет свидетельствовать о том, что исходное сообщение относится к типу Т2 табл. 4.6; ответ в) — исходное сообщение относится к типу Т10 той же таблицы. Далее появляются гипотезы о том, что сообщение эксперта интерпретируется отношением R2 или R10 в зависимости от ответа а) или в). Повышение степени достоверности такой гипотезы возможно при использовании стратегии подтверждения сходства [Осипов, 1989J.

Стратегия подтверждения сходства является комбинированной, основанной на взаимодействии стратегий разбиения на ступени и выявления сходства, а также на анализе свойств событий (если они определены).
Например, в результате работы стратегии выявления сходства установлена принадлежность предыдущего примера отношению R2. На основании определения отношения R2 для всякого свойства первого события найдется единственное свойство второго события, и наоборот, так что область значения свойства первого события является подобластью области значений соответствующего свойства второго события. В случае выполнения этого условия гипотеза о принадлежности предыдущего примера отношению R2 считается достоверным утверждением, в противном случае запускается стратегия разбиения на ступени с целью выявления новых свойств событий, для которых было бы верно это условие. Если, несмотря на это, условие достоверности не выполняется, то статус гипотезы сохраняется, однако в базе знаний системы появляется информация о некорректности соответствующей связи между событиями. Эта информация ограничивает возможность использования построенной связи, например, с точки зрения механизма наследования свойств. При работе стратегий выявления и подтверждения сходства сценарий работы называется системой.
Моделирование рассуждений в системе MIR
Введем следующие обозначения:
• О — опрос признаков из множества S;
• П — порождение множества гипотез Г;
• И — исключение множества гипотез Г.
Элементы данных типа «стрелка», соответствующие отношению R,.,, будем называть отрицательными связями, остальные — положительными.
Работа системы MIR начинается с работы модуля О, затем модуль П строит множество гипотез Г на основе анализа положительных связей S с Г для подтвержденных признаков S. Множество гипотез Г используется модулем О для порождения нового множества признаков S1, связанных с гипотезами из Г положительными связями, и осуществления их тестирования. К подтвержденным признакам из S, применяется модуль П для порождения нового множества гипотез Г1. Выполняются операции Г: = Г И Г1 S: = S И S1. Этот процесс продолжается итеративно до стабилизации множества S и Г. Затем выполняется модуль И исключения гипотез из Г на основе анализа отрицательных связей для подтверждения симптомов и анализа положительных связей для обусловленных признаков, то есть таких неподтвержденных признаков, отсутствие которых имеет большее значение для принятия решения, чем их присутствие.
Если в результате выполнения модуля И во множестве гипотез осталось более одной гипотезы, то выполняется поиск дифференциальных признаков для подмножеств множества гипотез (дифференциальным признаком для некоторого множества гипотез называется значение свойства, характерное для одной гипотезы из множества и нехарактерное для других, или событие, связанное положительной связью с одной гипотезой из множества и не связанное таковой с другими). В результате этого процесса происходит исключение соответствующих гипотез. При необходимости процедура повторяется для оставшегося множества гипотез до его стабилизации.
После выполнения еще нескольких модулей осуществляется анализ полученного множества гипотез с целью поиска его минимального подмножества, связанного положительными связями со всеми подтвержденными признаками и тем самым объясняющего их. Это последнее множество и считается окончательным результатом.


Новые тенденции и прикладные
аспекты инженерии знаний

Ё Латентные структуры знаний и психосемантика
Ё Метод репертуарных решеток
ЁУправление знаниями
Ё Визуальное проектирование баз знаний как инструмент познания
Ё Проектирование гипермедиа БД и адаптивных обучающих систем

5.1. Латентные структуры знаний и
психосемантика

Большинство систем приобретения знаний (обзор в п. 4.5) облегчают сложный и трудоемкий процесс формирования баз знаний и реализуют прямой диалог с экспертом. Однако выявляемые таким образом структуры знаний часто отражают лишь поверхностную составляющую знаний эксперта, не затрагивая их глубинной структуры. Этим же недостатком обладает большинство методов непосредственного извлечения знаний (параграфы 4.1.-4.3).
Для извлечения глубинных пластов экспертного знания можно воспользоваться методами психосемантики — науки, возникшей на стыке когнитивной психологии, психолингвистики, психологии восприятия и исследований индивидуального сознания. Психосемантика исследует структуры сознания через моделирование индивидуальной системы знаний [Петренко, 1988] и выявление тех категориальных структур сознания, которые могут не осознаваться (латентные, имплицитные или скрытые) [Петренко, 1983; Терехина, 1988; Шмелев, 1983].

5.1.1. Семантические пространства
и психологическое шкалирование

Основным методом экспериментальной психосемантики является метод реконструкции субъективных семантических пространств. Здесь психосемантика тесно сплетается с психолингвистикой и лингвистической семантикой — с методологией выявления значений слов, лексикографией, «падежной грамматикой» и структурными исследованиями [Апресян, 1977; Мельчук, 1974; Соссюр, 1977; Филлмор, 1983; Щерба, 1974]. Однако лингвистические методы в основном направлены на анализ текстов, отчужденных от субъекта, от его мотивов и замыслов.
Психолингвистические методы обращаются непосредственно к испытуемому. Большинство из них связано с различными формами субъективного шкалирования. Перед испытуемым ставится задача оценить «сходство знаний» с помощью некоторой градуированной шкалы, например от 0 до 5 или от 0 до 9. В этом случае исследователь получает в руки численно представленные стандартизированные данные, легко поддающиеся статистической обработке.
Психосемантика — как одно из молодых направлений современной психологии [Петренко, 1988; Шмелев, 1983] — сразу была оценена специалистами в области искусственного интеллекта как перспективный инструмент, позволяющий реконструировать семантическое пространство памяти как психологическую модель глубинной структуры знаний эксперта. Уже первые приложения психосемантики в ИИ в середине 80-х годов позволили получить достаточно наглядные результаты. В психологии семантические пространства выступают как модель категориальной структуры индивидуального сознания. При концептуальном анализе знаний структуру семантического пространства эксперта можно считать основой для формирования поля знаний. При этом отдельные параметры семантического пространства соответствуют различным компонентам поля (размерность пространства соотносится со сложностью поля, выделенные понятийные структуры с метапонятиями, содержательные связи между понятиями-стимулами — это суть отношения и т. д.).
Легче всего познакомиться с экспериментальной психосемантикой на примере, связанном с выявлением структуры и размерности семантического пространства знаний из некоторой предметной области [Петренко, 1988].
В основе построения семантических пространств, как правило, лежит статистическая процедура (например, факторный анализ [Аверкин, Батыршин, Блишун и др., 1986], многомерное шкалирование [Тиори, Фрай, 1985] или кластерный анализ [Дюран, Оделл, 1977]), позволяющая группировать ряд отдельных признаков описания в более емкие категории-факторы. Говоря на языке поля знаний, это — построение концептов более высокого уровня абстракции. При геометрической интерпретации семантического пространства значение отдельного признака отображается как точка или вектор с заданными координатами внутри n-мерного пространства, координатами которого выступают выделенные факторы. Построение семантического пространства, таким образом, включает переход к описанию предметной области на более высоком уровне абстракции, то есть переход от языка, содержащего большой алфавит признаков описания, к более емкому языку концептуализации, содержащему меньшее число концептов и выступающему своеобразным метаязыком по отношению к первому.
В зависимости от опыта и профессиональной компетентности испытуемых размерность пространства и расположение в ней первичных понятий может существенно варьироваться. Эта особенность семантических пространств может быть использована на стадии контроля в процессах обучения, при тестировании экспериментов и пользователей.


Пример 5.1
Так, для проверки знаний и понимания английского языка в работе [Терехина, 1988] были взяты десять наиболее распространенных предлогов, достаточно трудно переводимых. На экране дисплея испытуемому предъявлялась пара предлогов и спрашивалось, часто ли у него вызывает затруднения выбор одного из этих предлогов. Степень затруднения оценивалась в баллах от 1 до 9. На этих данных методами многомерного шкалирования была построена структура сложности употребления английских предлогов с точки зрения носителя русского языка. Эта модель существенно зависит от уровня знаний. Так, модель новичка не представляет организованной структуры. У людей, имеющих определенные навыки, проявилась некоторая структурированность семантического пространства, в нем отчетливо обозначились пары и тройки сходных предлогов.



Рис. 5.1. Семантическое пространство близости английских предлогов

Наиболее четкая и связная структура приведена на рис. 5.1. По ней можно объяснить особенности дифференциации предлогов в английском языке. Основа структуры представляется в виде окружности, близкие точки на которой соответствуют трудно дифференцируемым предлогам. Структура опирается на две ортогональные оси. Ось абсцисс соответствует предлогам направления движения, а ось ординат — предлогам цели — средства.

На основании получаемых методами психосемантики моделей можно проводить контроль знаний. При анализе индивидуальных семантических пространств выявляются вопросы, которые не усвоены и не уложились в систему. Контроль структуры знаний проводится на основе сопоставления семантических пространств хороших специалистов и новичков (студентов, слушателей, молодых специалистов). Степень согласованности семантических пространств (их размерности, признаки и конфигурации понятий) будет определять уровень знаний новичка.
Однако здесь необходимо учесть, что семантические пространства двух квалифицированных специалистов могут быть разными, так как содержат индивидуальные различия восприятия, отражающие опыт и характер деятельности человека. Поэтому не всегда можно формально сравнить семантические пространства эксперта и новичка, следует предварительно изучить семантические пространства нескольких специалистов, а затем уж производить сравнение.
В работе [Кук, Макдональд, 1986] описан подобный эксперимент. Были получены когнитивные структуры знаний опытного летчика-истребителя и пилота-новичка, с использованием двух методов: многомерного шкалирования (алгоритм MDS — Alscal) и сетевого шкалирования со взвешенными связями (алгоритм Pathfinder). Оба алгоритма основаны на использовании оценок психологической близости. Опытный пилот и пилот-новичок оценивали все возможные парные сочетания 30 связанных с полетом понятий, приписывая числа от 0 до 9 каждой паре, где 0 обозначал самую слабую степень связи между понятиями, а 9 — самую сильную. Эти оценки затем обрабатывались с применением обоих алгоритмов шкалирования.
В соответствии с алгоритмами MDS каждый концепт, выражающий некоторое понятие, помещается в к-мерное пространство таким образом, что расстояние между точками отражает психологическую близость соответствующих концептов. Алгоритм Pathfinder строит семантическую сеть [Schvaneveldt, Durso, Dearholt, 1985]. Дуги могут быть либо ориентированными (несимметричное отношение), либо неориентированными (симметричное отношение). Оба метода обеспечивают сжатия больших объемов данных (в форме попарных оценок) к меньшему набору параметров; однако нацелены они на выявление разных свойств исследуемых структур. Если в алгоритме Pathfinder центром внимания являются локальные отношения между концептами, то алгоритм MDS обеспечивает более широкое понимание свойств метризуемого пространства концептов.
Результирующие когнитивные структуры оказались близкими для летчиков-истребителей с одинаковым уровнем опыта, но были различными для разных групп испытуемых. Авторы экспериментов обнаружили, что по когнитивной структуре, характерной для летчика-истребителя, можно установить, новичок он или опытный пилот. Наконец, проведенный ими же анализ когнитивных структур выявил наличие концептов и отношений, общих для представлений опытного специалиста и новичка, и, кроме того, ряд концептов и отношений, которые появились только в одном из представлений. Прямым развитием рассмотренной работы стала экспертная система управления воздушным боем ACES [Goldsmith, Schvaneveldt, 1985].
Аналогичное исследование механизмов накопления опыта было проведено в области программирования на ЭВМ [Cooke, 1985]. С помощью методов шкалирования было показано, что один из аспектов программистского опыта включает в себя организацию знаний соответственно замыслу программы, или семантике, а не в соответствии с синтаксисом.

Пример 5.2
Сетевое представление абстрактных понятий программирования на основе оценок связности концептов у программистов показано на рис. 5.2. Эксперимент показал, что всех программистов на основе анализа структуры семантического пространства можно разбить на три группы: новички, неопытные специалисты среднего уровня, опытные специалисты. Это заключение совпадает с результатами, полученными в работе [Гаврилова, 1984]. Кроме того, исследовалась эволюция когнитивной структуры программиста по мере его продвижения от новичка до опытного специалиста.



Рис. 5.2. Ассоциативная сеть структуры знаний эксперта-программиста

Интерпретация выявленных отношений (связей) между понятиями требует дополнительных усилий от коллектива разработчиков ЭС. Так, например, означивание дуг на рис. 5.2. потребовало дополнительного эксперимента, участникам которого была предложена пара понятий и поставлена задача дать словесное описание связи между понятиями пары. Результаты представлены в табл. 5.1. Таким образом, ассоциативная сеть на рис. 5.2 может быть превращена в семантическую.
Таблица 5.1.
Описание связи между понятиями
Связанные пары понятий
Отношение между связанной парой понятий
Подпрограмма — программа
Есть часть
Символьные данные — выход
Есть тип
Параметр — программа
Используется
Программа — выход
Производит
Сортировка — поиск
Включает в себя
Численные данные — параметр
Может быть
Функция — оператор
Есть
Функция — программа
Есть часть
Отладка — программа
Подвергается
Выход — численные данные
Состоит из
Массив — символьные данные
Может состоять из
Функция — подпрограмма
Есть
Присваивание значений —параметр
Используется для
Массив — глобальная перемена
Может быть
Массив — численные данные
Может состоять из
Повторение — сортировка
Есть часть
Программа — алгоритм
Есть выполнение
Сортировка —алгоритм
Есть
Сортировка — численные данные
Делается на
Присваивание —оператор
Есть
Все упомянутые выше методы (включая кластерный анализ) можно отнести к методам психологического шкалирования. Их основу составляют алгоритмы преобразования сложных структур данных в более понятную форму, которая предполагается психологически содержательной. Результирующее представление зависит от метода:
• кластерный анализ порождает древовидную структуру [Дюран, Оделл, 1977];
• многомерное шкалирование и факторный анализ — пространственную [Окунь, 1974; Терехина, 1986];
• алгоритм MDS — сетевую [Кук, Макдональд, 1986];
• репертуарные решетки (см. параграф 5.2 и работу [Франселла, Баннистер, 1987]) порождают конструкты или метаизмерения [Kintsch, 1974].
Формальная методология психосемантического шкалирования позволяет частично автоматизировать процесс структурирования знаний и получать «когнитивный разрез» его представлений о предметной области. Методология шкалирования позволяет выявлять структуры знания косвенным путем при получении ответов от экспертов на довольно простые вопросы (например, «насколько близки понятия X, и Х2» вместо «скажите, какова связь между X, и Х2 как они влияют друг на друга»).
Почти все эксперименты позволили выявить одну закономерность. Размерность семантического пространства с повышением уровня профессионализма уменьшается. Этот вывод согласуется с известными положениями когнитивной психологии о том, что процесс познания сопровождается обобщением. Построение семантического пространства обычно включает три последовательных шага [Петренко, 1983].
1. Выбор и применение соответствующего метода оценки семантического сходства. Этот шаг включает в себя эксперимент с испытуемыми, которым предлагается оценить общность предъявляемых стимульных признаков на некоторой шкале.
2. Построение структуры семантического пространства на основе математического анализа полученной матрицы сходства. При этом происходит уменьшение числа исследуемых понятий за счет обобщения и получения генерализованных осей.
3. Идентификацию, интерпретацию выделенных факторных структур, кластеров или групп объектов, осей и т. д. На этом шаге необходимо найти смысловые эквиваленты, языковые «ярлыки» для выделенных структур. Здесь большое значение приобретает лингвистическое чутье и профессионализм специалиста, проводящего исследование, и экспертов-испытуемых. Часто к интерпретации привлекают группу экспертов.

5.1.2. Методы многомерного шкалирования

В дальнейшем развитие методов психосемантики шло по линии разработки удобных пакетов прикладных программ, основанных на методах многомерного шкалирования (МШ), факторного анализа, а также специализированных методов (статистической) обработки репертуарных решеток [Франселла, Баннистер, 1987]. Примерами пакетов такого типа являются системы KELLY [Похилько, Страхов, 1990], MADONNA [Терехина, 1988], MEDIS [Алексеева, Воинов и др., 1989]. С другой стороны, специфика ряда конкретных приложений, прежде всего—в инженерии знаний, требовала также развития иных (не численных) методов обработки психосемантических данных, использующих — в той или иной форме — парадигму логического вывода на знаниях. Ярким примером этого направления служит система AQUINAS [Boose et al., 1989; Boose, 1990]. Однако анализ практического применения систем обоих типов к задачам инженерии знаний приводит к выводу о несовершенстве имеющихся методик и необходимости их развития в соответствии с современными требованиями инженерии знаний. Наибольшие перспективы в этой области, по-видимому, у методов многомерного шкалирования.
Многомерное шкалирование (МШ) сегодня — это математический инструментарий, предназначенный для обработки данных о попарных сходствах, связях или отношениях между анализируемыми объектами с целью представления этих объектов в виде точек некоторого координатного пространства. МШ представляет собой один из разделов прикладной статистики, научной дисциплины, разрабатывающей и систематизирующей понятия, приемы, математические методы и модели, предназначенные для сбора, стандартной записи, систематизации и обработки статистических данных с целью их лаконичного представления, интерпретации и получения научных и практических выводов. Традиционно МТТТ используется для решения трех типов задач:
1. Поиск и интерпретация латентных (то есть скрытых, непосредственно не наблюдаемых) переменных, объясняющих заданную структуру попарных расстояний (связей, близостей).
2. Верификация геометрической конфигурации системы анализируемых объектов в координатном пространстве латентных переменных.

<< Предыдущая

стр. 11
(из 26 стр.)

ОГЛАВЛЕНИЕ

Следующая >>