<< Предыдущая

стр. 5
(из 26 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

Извлечение знаний (knowledge elicitation) — это процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области.
В настоящее время большинство разработчиков ЭС отмечает, что процесс извлечения знаний остается самым «узким» местом при построении промышленных ЭС. При этом им приходится практически самостоятельно разрабатывать методы извлечения, сталкиваясь со следующими трудностями [Gaines, 1989]:
• организационные неувязки;
• неудачный метод извлечения, не совпадающий со структурой знаний в данной области;
• неадекватная модель (язык) для представления знаний.
Можно добавить к этому [Гаврилова, Червинская, 1992]:
• неумение наладить контакт с экспертом;
• терминологический разнобой;
• отсутствие целостной системы знаний в результате извлечения только «фрагментов»;
• упрощение «картины мира» эксперта и др.
Процесс извлечения знаний — это длительная и трудоемкая процедура, в которой инженеру по знаниям, вооруженному специальными знаниями по когнитивной психологии, системному анализу, математической логике и пр., необходимо воссоздать модель предметной области, которой пользуются эксперты для принятия решения. Часто начинающие разработчики ЭС, желая упростить эту процедуру, пытаются подменить инженера по знаниям самим экспертом. По многим причинам это нежелательно.
Во-первых, большая часть знаний эксперта — это результат многочисленных наслоений, ступеней опыта. И часто, зная, что из А следует В, эксперт не отдает себе отчета, что цепочка его рассуждений была гораздо длиннее, например А ® D ® С ® В или А ® Q ® R ® В.
Во-вторых, как было известно еще Платону, мышление диалогично. И поэтому диалог инженера по знаниям и эксперта — наиболее естественная форма изучения лабиринтов памяти эксперта, в которых хранятся знания, частью носящие невербальный характер, то есть выраженные не в форме слов, а в форме наглядных образов, например. И именно в процессе объяснения инженеру по знаниям эксперт на эти размытые ассоциативные образы надевает четкие словесные ярлыки, то есть вербализует знания.
В-третьих, эксперту труднее создать модель предметной области вследствие глубины и объема информации, которой он владеет. Еще в ситуационном управлении [Поспелов, 1986] было выявлено: объекты реального мира связаны более чем 200 типами отношений (временные, пространственные, причинно-следственные, типа «часть—целое» и др.). Эти отношения и связи предметной области образуют сложную систему, из которой выделить «скелет» или главную структуру иногда доступнее аналитику, владеющему к тому же системной методологией.
Термин «приобретение» в рамках данного учебника оставлен за автоматизированными системами прямого общения с экспертом. Они действительно непосредственно приобретают уже готовые фрагменты знаний в соответствии со структурами, заложенными разработчиками систем. Большинство этих инструментальных средств специально ориентировано на конкретные ЭС с жестко обозначенной предметной областью и моделью представления знаний, то есть не являются универсальными.

Например, система TEIRESIAS [Davis, 1982], ставшая прародительницей всех инструментариев для приобретения знаний, предназначена для пополнения базы знаний системы MYCIN или ее дочерних ветвей, построенных на «оболочке» EMYCIN [Shortliffe, 1976] в области медицинской диагностики с использованием продукционной модели представления знаний. Три поколения и основные тенденции СПЗ будут подробно описаны в параграфе 4.5. Более современные конкретные системы описаны далее в параграфе 4.6.
Термин формирование знаний традиционно закрепился за чрезвычайно перспективной и активно развивающейся областью инженерии знаний, которая занимается разработкой моделей, методов и алгоритмов обучения. Она включает индуктивные модели формирования знаний и автоматического порождения гипотез, например ДСМ-метод [Аншаков, Скворцов, Финн, 1986] на основе обучающих выборок, обучение по аналогии и другие методы. Эти модели позволяют выявить причинно-следственные эмпирические зависимости в базах данных с неполной информацией, содержащих структурированные числовые и символьные объекты (часто в условиях неполноты информации).

Традиционно к задачам формирования знаний или машинного обучения относятся задачи прогнозирования, идентификация (синтеза) функций, расшифровки языков, индуктивного вывода и синтеза с дополнительной информацией [Епифанов, 1984]. В широком смысле к обучению по примерам можно отнести и методы обучения распознаванию образов [Аткинсон, 1989; Schwartz, 1988].
Индуктивный вывод правил из фактов применен также в системах AQ, AQUINAS, KSS1, INSTIL и некоторых других.
Наиболее продвинутыми среди методов машинного обучения являются, по-видимому, методы распознавания образов, в частности, алгебраический подход, в котором предусматривается обогащение исходных эвристических алгоритмов с помощью алгебраических операций и построение семейства алгоритмов, гарантирующего получение корректного алгоритма для решения изучаемого класса задач, то есть алгоритма, правильно классифицирующего конечную выборку по всем классам [Берков, 1972]. Однако применение методов формирования знаний пока не стало промышленной технологией разработки баз знаний.
Для того чтобы эти методы стали элементами технологии интеллектуальных систем, необходимо решить ряд задач [Осипов, 1997]:
• обеспечить механизм сопряжения независимо созданных баз данных, имеющих различные схемы, с базами знаний интеллектуальных систем;
• установить соответствие между набором полей базы данных и множеством элементов декларативной компоненты базы знаний;
• выполнить преобразование результата работы алгоритма обучения в способ представления, поддерживаемый программными средствами интеллектуальной системы.
Помимо перечисленных существуют также и другие стратегии получения знаний, например, в случае обучения на примерах (case-based reasoning), когда источник знаний — это множество примеров предметной области [Осипов, 1997; Попов, Фоминых, Кисель, 1996]. Обучение на основе примеров (прецедентов) включает настройку алгоритма распознавания на задачу посредством предъявления примеров, классификация которых известна [Ибер-ла, 1980].
Обучение на примерах тесно связано с машинным обучением. Различие заключается в том, что результат обучения в рассматриваемом здесь случае должен быть интерпретирован в некоторой модели, в которой, возможно, уже содержатся факты и закономерности предметной области, и преобразован в способ представления, который допускает использование результата обучения в базе знаний, для моделирования рассуждений, для работы механизма объяснения и т. д., то есть делает результат обучения элементом соответствующей технологии.
Например, в системе INDUCE [Коов и др., 1988] порождается непротиворечивое описание некоторого класса объектов по множествам примеров и контр-примеров данного класса. В качестве языка представления используется язык перемен-но-значной логики первого порядка (вариант языка многозначной логики первого порядка).
Следует отметить также появление двух новых «флагов» в стане сторонников методов машинного обучения — это data mining и knowledge discovery. Оба подхода базируются на анализе данных и поиске закономерностей.
Таким образом, можно выделить три основные стратегии проведения стадии получения знаний при разработке ЭС (рис. 3.6).



Рис. 3.6. Стратегии получения знаний

1. С использованием ЭВМ при наличии подходящего программного инструментария, иначе приобретение знаний.
2. С использованием программ обучения при наличии репрезентативной (то есть достаточно представительной) выборки примеров принятия решений в предметной области и соответствующих пакетов прикладных программ, иначе формирование знаний.
3. Без использования вычислительной техники путем непосредственного контакта инженера по знаниям и источника знаний (будь то эксперт, специальная литература или другие источники), иначе извлечение знаний.
В учебнике подробно будут рассматриваться процессы извлечения и приобретения знаний, так как на современном этапе разработки ЭС эти стратегии являются наиболее эффективными и перспективными. Формирование знаний, тяготеющее в большей степени к области machine learning, то есть индуктивному обучению, основываясь на хорошо исследованном аппарате распознавания образов [Гаек, Гавранек, 1983] и обнаружения сходства объектов [Гусакова, Финн, 1987], выходит за рамки данного учебника. Также вне этой книги остались вопросы формирования знаний из данных (data mining, knowledge discovery) и др.

3.3. Теоретические аспекты извлечения
знаний

Поскольку основной проблемой инженерии знаний является процесс извлечения знаний, инженеру по знаниям необходимо четко понимать природу и особенности этих процессов. Для того чтобы разобраться в природе извлечения знаний, выделим три основных аспекта этой процедуры (рис. 3.7):
А = {А1, А2, A3} = {психологический, лингвистический, гносеологический}.


Рис. 3.7. Теоретические аспекты инженерии знаний

3.3.1. Психологический аспект

Из трех аспектов извлечения знаний психологический — А1 — является ведущим, поскольку он определяет успешность и эффективность взаимодействия инженера по знаниям (аналитика) с основным источником знаний — экспертом-профессионалом. Психологический аспект выделяется еще и потому, что извлечение знаний происходит чаще всего в процессе непосредственного общения разработчиков системы. А в общении психология является доминантной.
Общение, или коммуникация (от лат. communicatio — связь), — это междисциплинарное понятие, обозначающее все формы непосредственных контактов между людьми — от дружеских до деловых. Оно широко исследуется в психологии, философии, социологии, этологии, лингвистике, семиотике и других науках. Существует несколько десятков теорий общения, и единственное, в чем сходятся все авторы, — это сложность, многоплановость процедуры общения. Подчеркивается, что общение — не просто однонаправленный процесс передачи сообщений и не двухтактный обмен порциями сведений, а нерасчлененный процесс циркуляции информации, то есть совместный поиск истины [Каган, 1988] (рис. 3.8).


Рис. 3.8. Структура процесса общения
Итак, общение есть процесс выработки новой информации, общей для общающихся людей и рождающей их общность. И хотя общение — первый вид деятельности, которым овладевает человек в онтогенезе, по-настоящему владеют культурой и наукой общения единицы.
Можно выделить четыре основных уровня-общения [Сагатовский, 1980].
1. Уровень манипулирования, когда один субъект рассматривает другого как средство или помеху по отношению к проекту своей деятельности.
2. Уровень «рефлексивной игры», когда в процессе своей деятельности человек учитывает «контрпроект» другого субъекта, но не признает за ним самоценность и стремится к «выигрышу», к реализации своего проекта.
3. Уровень правового общения, когда субъекты признают право на существование проектов деятельности друг друга и пытаются согласовать их хотя бы внешне.
4. Уровень нравственного общения, когда субъекты внутренне принимают общий проект взаимной деятельности.
Стремление и умение общаться на высшем, четвертом, уровне может характеризовать степень профессионализма инженера по знаниям. Извлечение знаний — это особый вид общения, который можно отнести к духовно-информационному типу. Согласно работе [Каган, 1988] общение делится на материально-практическое; духовно-информационное; практически-духовное. При этом информационный аспект общения для инженера по знаниям с прагматической точки зрения важнейший.
Известно, что потери информации при разговорном общении велики [Мицич, 1987] (рис. 3.9).



Рис. 3.9. Потери информации при разговорном общении

В связи с этим рассмотрим проблему увеличения информативности общения аналитика и эксперта за счет использования психологических знаний. Можно выделить такие структурные компоненты модели общения при извлечении знаний:
• участники общения (партнеры);
• средства общения (процедура);
• предмет общения (знания).
В соответствии с этой структурой выделим три «слоя» психологических проблем, возникающих при извлечении знаний (рис. 3.10):
Al = {S11, S12, S13 } = (контактный, процедурный, когнитивный).



Рис. 3.10. Психологический аспект извлечения знаний

Контактный слой (S11)
Практически все психологи отмечают, что на любой коллективный процесс влияет атмосфера, возникающая в группе участников. Существуют эксперименты, результаты которых неоспоримо говорят, что часто дружеская атмосфера в коллективе больше влияет на результат, чем индивидуальные способности отдельных членов группы [Немов, 1984]. Особенно важно, чтобы в коллективе разработчиков складывались кооперативные, а не конкурентные отношения. Для кооперации характерна атмосфера сотрудничества, взаимопомощи, заинтересованности в успехах друг друга, то есть уровень нравственного общения, а для отношений конкурентного типа — атмосфера индивидуализма и межличностного соперничества (более низкий уровень общения).
В настоящее время прогнозировать совместимость в общении со 100%-й гарантией невозможно. Однако можно выделить ряд факторов и черт личности, характера и других особенностей участников общения, несомненно, оказывающих влияние на эффективность процедуры.
Разработка проблематики контактного слоя позволила выявить следующие параметры партнеров, влияющие на результаты процедуры извлечения знаний: S11 = {s11_i} = {пол, возраст, личность, темперамент, мотивация и др.}, часть из которых впоследствии вошли в формирование модели пользователя. Значения параметров пола (s11_1) и возраста (s11_2) хотя и влияют на эффективность контакта, но не являются критическими. В литературе [Иванов, 1986] отмечается, что хорошие результаты дают гетерогенные пары (мужчина/женщина) и соотношение:
20 > (Вэ – Ва) > 5,
где Вэ, — возраст эксперта; Ва — возраст аналитика.
Под личностью (s11_3) обычно понимается устойчивая система психологичест ких черт, характеризующая индивидуальность человека. Рекомендуемые компоненты s11_3 исследованы в работе [Гаврилова, 1990] и дополнены качествами из руководства для журналистов в работе [Schouksmith G., 1978]. S11_3 = (доброжелательность, аналитичность, хорошая память, внимание, наблюдательность, воображение, впечатлительность, большая собранность, настойчивость, общительность, находчивость).
Со времен Галена и Гиппократа, выделивших четыре классических типа темперамента (s11_4), вошли в научную терминологию понятия s11_4 = (холерик, сангвиник, меланхолик, флегматик).
Известно, что флегматики и меланхолики медленнее усваивают информацию [Лунева, Хорошилова, 1987]. И для обеспечения психологического контакта с ними не следует задавать беседе слишком быстрый темп, торопить их с ответом. Зато они гораздо лучше усваивают новое, в отличие от холериков, для которых свойственно поверхностное усваивание информации. Последних следует специально наводить на размышление и рефлексию. У меланхоликов часто занижена самооценка, они застенчивы и в беседе их надо подбадривать. Таким образом, наиболее успешными в рамках слоя S11 являются сангвиники и холерики. На эффективность коллективного решения задач влияет также и мотивация (s11_5), то есть стремление к успеху. Инженер по знаниям в зависимости от условий разработки должен изыскивать разнообразные стимулы для экспертов (включая, разумеется, и материальные). Эксперт передает аналитику один из самых дорогих в мире продуктов — знания. И если одни люди делятся опытом добровольно и с удовольствием, то другие весьма неохотно приоткрывают свои профессиональные тайны. Иногда полезно оказывается возбудить в эксперте дух соперничества, конкуренции (не нарушая, естественно, обстановки кооперативности в коллективе).

Процедурный слой (S12)
Параметры процедурного слоя S12 описывают непосредственно процесс проведения процедуры извлечения знаний. Фактически это профессиональные параметры:
S12 = {s12_i} = {ситуация общения (место, время, продолжительность); оборудование (вспомогательные средства, освещенность, мебель); профессиональные приемы (темп, стиль, методы и др.)}.
Инженер по знаниям, успешно овладевший наукой установления атмосферы доверия и взаимопонимания с экспертом (контактный слой — S11), должен еще суметь воспользоваться благоприятным воздействием этой атмосферы. Проблема процедурного слоя касается проведения самой процедуры извлечения знаний. Здесь мало проницательности и обаяния, полезных для решения проблемы контакта, тут необходимы профессиональные знания.
Остановимся на общих закономерностях проведения процедуры.
S12_l — ситуация общения определяется следующими компонентами:
• s12_l_l — место проведения сеансов;
• s12_l_2 — продолжительность проведения сеансов;
• s12_l_3 — время проведения сеансов.
Беседу с экспертом лучше всего проводить в небольшом помещении наедине (s12_l_l: место), поскольку посторонние люди нарушают доверительность беседы и могут породить эффект «фасада». Рабочее место эксперта является не самым оптимальным вариантом, так как его могут отвлекать телефонные звонки, сотрудники и пр. Атмосфера замкнутого пространства и уединенности положительно влияет на эффективность.
Американский психолог И. Атватер считает, что для делового общения наиболее благоприятная дистанция от 1,2 до 3 метров [Schouksmith, 1978]. Минимальным «комфортным» расстоянием можно считать 0,7 - 0,8 метра.
Реконструкция собственных рассуждений — трудоемкий процесс, и поэтому длительность одного сеанса (s12_l_2: продолжительность) обычно не превышает 1,5 - 2 часа. Эти два часа лучше выбрать в первой половине дня, например с 10 до 12 часов, если эксперт типа «жаворонок» (s12_l_3: время). Известно, что взаимная утомляемость партнеров при беседе наступает обычно через 20 - 25 минут [Ноэль, 1978], поэтому в сеансе нужны паузы.
s12_2 — оборудование включает:
• s12_2_l — вспомогательные средства;
• s12_2_2 — освещенность;
• s12_2_3 - мебель.
Вспомогательные средства (s12_2_l):
• средства для увеличения эффективности самого процесса извлечения знаний;
• средства для протоколирования результатов.
К средствам для увеличения эффективности процесса извлечения знаний прежде всего относится наглядный материал. Независимо от метода извлечения (см. главу 4), выбранного в конкретной ситуации, его реализация возможна разными способами. Например, можно учитывать следующий фактор: широко известно, что людей, занимающихся интеллектуальной деятельностью, можно отнести к художественному либо мыслительному типу. Термины тут условны и не имеют отношения к той деятельности, которую традиционно называют художественной или мыслительной. Важно, что, определив тип эксперта, инженер по знаниям может плодотворнее использовать любой из методов извлечения, зная, что люди художественного типа легче воспринимают зрительную информацию в форме рисунков, графиков, диаграмм, так как эта информация воспринимается через первую сигнальную систему. Напротив, эксперты мыслительного типа лучше понимают язык формул и текстовую информацию. При этом учитывается факт, что большую часть информации человек получает от зрения. Совет пользоваться активнее наглядным материалом из работы [Хейес—Рот, Уотермена, Ленат, 1987] можно считать универсальным. Такие методы, как свободный диалог и игры, предоставляют богатые возможности использовать слайды, чертежи, рисунки. Для протоколирования результатов в настоящее время используются следующие способы:
• запись на бумагу непосредственно по ходу беседы (недостатки — это часто мешает беседе, кроме того, трудно успеть записать все, даже при наличии навыков стенографии);
• магнитофонная запись (диктофон), помогающая аналитику проанализировать весь ход сеанса и свои ошибки (недостаток — может сковывать эксперта);
• запоминание с последующей записью после беседы (недостаток — годится только для аналитиков с блестящей памятью).
Наиболее распространенным способом на сегодня является первый. При этом наибольшая опасность тут — потеря знаний, поскольку любая запись ответов — это уже интерпретация, то есть привнесение субъективного понимания предмета. Значения параметров освещенности (s12_2_2) и мебели (s12_2_3) очевидны и связаны с влиянием внешних факторов на эксперта.
S12_3 — профессиональные приемы аналитика, включают, в частности:
• s12_3_l — темп;
• s12_3_2 — стиль;
• s12_3_3 — методы.
Учет индивидуального темпа (s12_3_l) и стиля (s12_3_2) эксперта позволяет аналитику снизить напряженность процедуры извлечения знаний. Типичной ошибкой является навязывание собственных темпа и стиля. На успешность также влияет длина фраз, которые произносит инженер по знаниям. Этот факт был установлен американскими учеными — лингвистом Ингве и психологом Миллером при проведении исследования о причинах низкой усвояемости команд на Военно-морском флоте США [Gammack, Young, 1985]. Причина была в длине команд. Оказалось, что человек лучше всего воспринимает предложения глубиной (или длиной) 7+2(-2) слова. Это число (7±2) получило название число Ингве—Миллера. Можно считать его мерой «разговорности» речи. Опытные лекторы используют в лекции в основном короткие фразы, уменьшая потерю информации с 20-30 % (у плохих лекторов) до 3-4 % [Горелов, 1987]. Большая часть информации поступает к инженеру по знаниям в форме предложений на естественном языке. Однако внешняя речь эксперта есть воспроизведение его внутренней речи (мышления), которая гораздо богаче и многообразнее.
При этом для передачи этой внутренней речи эксперт использует и невербальные средства, такие как интонация, мимика, жесты. Опытный инженер по знаниям старается записывать по возможности в протоколы (в форме ремарок) эту дополнительную интонацию.
В целом, невербальная компонента стиля общения важна и для проблем контактного слоя при установлении контакта, когда по отдельным жестам и выражению лица эксперта инженер по знаниям может установить границу возможной «дружественности» общения.
Значение параметра методов (s12_3_3) подробно рассмотрено в следующей главе, исходя из позиции, что метод должен подходить к эксперту как «ключ к замку».


Когнитивный слой (S13)
Когнитивные (от англ, cognition — познание) науки исследуют познавательные процессы человека с позиций возможности их моделирования (психология, нейрофизиология, эргономика, инженерия знаний). Наименее исследованы на сегодняшний день проблемы когнитивного слоя S13, связанные с изучением семантического пространства памяти эксперта и реконструкцией его понятийной структуры и модели рассуждений.
Основными факторами, влияющими на когнитивную адекватность, будут:
S13 = {s13_i} = (когнитивный стиль, семантическая репрезентативность поля знаний и концептуальной модели}.
Под когнитивным стилем (s13_1) человека понимается совокупность критериев предпочтения при решении задач и познании мира, специфическая для каждого человека. Когнитивный стиль определяет не столько эффективность деятельности, сколько способ достижения результата [Алахвердов, 1986]. Это способ познания, который позволяет людям с разными способностями добиваться одинаковых результатов в деятельности. Это система средств и индивидуальных приемов, к которым прибегает человек для организации своей деятельности.
Инженеру по знаниям полезно изучить и прогнозировать свой когнитивный стиль, а также стиль эксперта. Особенно важны такие характеристики когнитивного стиля, как:
• s13_l_l — (полезависимость — поленезависимость);
• s13_l_2 — (импульсивность — рефлективность (рефлексивность);
• S13_l_3 — (ригидность — гибкость);
• s13__l_4 — (когнитивная эквивалентность).
s13_l_l. Поленезависимость позволяет человеку акцентировать внимание лишь на тех аспектах проблемы, которые необходимы для решения конкретной задачи, и уметь отбрасывать все лишнее, то есть не зависеть отфона или окружающего задачу шумового поля. Эта характеристика коррелирует с такими чертами личности, как невербальный интеллект, аналитичность мышления, способность к пониманию сути. Очевидно, что помимо того, что самому аналитику необходимо иметь высокое значение параметра s!3_l_l, поленезависимый эксперт — это тоже желательный фактор. Однако приходится учитывать, что больше нуждаются в общении полезависимые люди, а потому они и более контактны [Орехов, 1985].
Особенно полезны для общения гетерогенные (смешанные) пары, например «полезависимый — поленезависимый» [Иванов, 1986]. В литературе описаны различные эксперименты, моделирующие общение, требующее понимания и совместной деятельности. Наиболее успешным в понимании оказались поленезависимые испытуемые (92 % успеха), для сравнения полезависимые давали 56 % успеха [Кулюткин, Сухобская, 1971].
Для совместной профессиональной деятельности важна также гибкость когнитивной организации, которая связана с поленезависимостью. Итак, большую способность к адекватному пониманию партнера демонстрируют субъекты с высокой психологической дифференциацией, то есть поленезависимостью. Поленезависимость является одной из характерных профессиональных черт когнитивного стиля наиболее квалифицированных инженеров по знаниям. По некоторым результатам [Алахвердов, 1986] мужчины более поленезависимы, чем женщины.
s13_l_2. Под импульсивностью понимается быстрое принятие решения (часто без его достаточного обоснования), а под рефлексивностью — склонность к рассудительности. Рефлексивность по экспериментальным данным коррелирует со способностью к формирования понятий и продуктивностью стратегий решения логических задач [Кулюткин, Сухобская, 1971]. Таким образом, и инженеру по знаниям, и эксперту желательно быть рефлексивным, хотя собственный стиль изменяется лишь частично и с большим напряжением.
s13_l_3. Ригидность — гибкость характеризует способность человека к изменению установок и точек зрения в соответствии с изменяющейся ситуацией. Ригидные люди не склонны менять свои представления и структуру восприятия, напротив, гибкие легко приспосабливаются к новой обстановке. Очевидно, что если эксперт еще может себе позволить ригидность (что характерно для долго работающих над одной проблемой специалистов, особенно старшего возраста), то для инженера по знаниям эта характеристика когнитивного стиля явно противопоказана. Увеличение ригидности с возрастом отмечается многими психологами [Кулюткин, Сухобская, 1971; Орехов, 1985].
s13_l_4. Когнитивная эквивалентность характеризует способность человека к различению понятий и разбиению их на классы и подклассы. Чем уже диапазон когнитивной эквивалентности, тем более тонкую классификацию способен провести индивид, тем большее количество признаков понятий он может выделить. Обычно у женщин диапазон когнитивной эквивалентности уже, чем у мужчин. Семантическая репрезентативность (s13_2) подразумевает подход, исключающий традиционное навязывание эксперту некой модели представлений (например, продукционной или фреймовой), и заставляет инженера по знаниям последовательно воссоздавать модель мира эксперта, используя как неформальные методы, так и математический аппарат, например многомерное шкалирование (см. главу 4). Проблема семантической репрезентативности ориентирована на достижение когнитивной адекватности поля знаний и концептуальной модели. В настоящий момент она может быть сформулирована как проблема «испорченного телефона» [Гаврилова, Червинская, 1992] (см. рис. 3.5) — возможные трансформации и потери в цепи передачи информации:
(Og: предметная область или реальный мир) ®
[Ii: интерпретация i-го эксперта] ®
(Mg: модель мира эксперта) ®
[Vi вербализация модели мира эксперта] ®
(Ti ? Сi: вербальные и невербальные сообщения i-го эксперта j- му аналитику) ®
[Ij: их интерпретация j-ым аналитиком] ®
(Mgi: модель мира j-го аналитика) ®
[Kj: кодирование при формировании поля знаний с последующей структуризацией в концептуальную модель].
Круглые скобки определяют понятия, квадратные — процессы.

3.3.2. Лингвистический аспект

Лингвистический (А2) аспект касается исследований языковых проблем, так как язык — это основное средство общения в процессе извлечения знаний. Сразу же следует оговорить, что поскольку тема данной книги ограничена изложением теории и технологии инженерии знаний, то область разработки естественно-языковых интерфейсов и весь спектр проблем, связанных с ней — лексических, синтаксических, семантических, прагматических и т. д. [Виноград, 1976; Мальковский, 1985; Попов, 1982], — не рассматривается.
В инженерии знаний можно выделить три слоя лингвистических проблем (рис. 3.11):
А2 = {S21, S22, S23} = («общий код», понятийная структура, словарь пользователя}.


Рис. 3.11. Лингвистический аспект извлечения знаний

«Общий код» (S21)
«Общий код» решает проблему языковых ножниц между профессиональной терминологией эксперта и обыденной литературной речью инженера по знаниям и включает следующие компоненты:
S21 = {s21_i} = {общенаучная терминология; специальные понятия из профессиональной литературы; элементы бытового языка; неологизмы, сформированные за время совместной работы; профессиональный жаргон и др.}.
Детализация схемы общения (см. рис. 3.8) на рис. 3.11 позволяет представить средства общения как два потока [Горелов, 1987], в которых нас интересуют компоненты V1 и V2 — языки, на которых говорят аналитик и эксперт (V1', V2' — невербальные компоненты). Различие языков V1 и V2 и обусловливает «языковый барьер» или «языковые ножницы» в общении инженера по знаниям и эксперта.
Эти два языка являются отражением «внутренней речи» эксперта и аналитика, поскольку большинство психологов и лингвистов считают, что язык — это основное средство мышления наряду с другими знаковыми системами «внутреннего пользования» (универсальный семантический код — УСК [Мартынов, 1977], языки «смысла» [Мельчук, 1974], концептуальные языки [Шенк, 1980] и др.).
Язык аналитика V1 состоит из трех компонентов:
• s21_l — общенаучной терминологии из его «теоретического багажа»;
• s21_2 — терминов предметной области, которые он почерпнул из специальной литературы в период подготовки;
• s21_3 — бытового разговорного языка, которым пользуется аналитик. Язык эксперта V2 включает:
• s21_l — общенаучную терминологию;
• s21_2 — специальную терминологию, принятую в предметной области;
• s21_3 — бытовой язык;
• s21_4 — неологизмы, созданные экспертом за время работы, то есть его профессиональный жаргон.
Если считать, что бытовой и общенаучный языки у двух участников общения примерно совпадают (хотя реально объем второго компонента у эксперта существенно больше), то некоторый общий язык или код, который необходимо выработать партнерам для успешного взаимодействия, будет складываться из потоков, представленных на рис. 3.12.



Рис. 3.12. Структура общего кода

В дальнейшем этот общий код преобразуется в некоторую понятийную (семантическую) сеть, которая является прообразом поля знаний предметной области.
Выработка общего кода начинается с выписыванием аналитиком всех терминов, употребляемых экспертом, и уточнения их смысла. Фактически это составление словаря предметной области. Затем следует группирование терминов и выбор синонимов (слов, означающих одно и то же). Разработка общего кода заканчивается составлением словаря терминов предметной области с предварительной группировкой их по смыслу, то есть по понятийной близости (это уже первый шаг структурирования знаний).
На этом этапе аналитик должен с большим вниманием отнестись ко всем специальным терминам, пытаясь максимально вникнуть в суть решаемых проблем и терминологию. Освоение аналитиком языка предметной области — первый рубеж на подступах к созданию адекватной базы знаний.
Рисунок 3.12 дает представление о процессе неоднозначности интерпретации терминов двумя специалистами. В семиотике, науке о знаковых системах, проблема интерпретации является одной из центральных. Интерпретация связывает «знак» и «означаемый предмет». Только в интерпретации знак получает смысл. Так, на рис. 3.13 слова «прибор X» для эксперта означает некоторую конкретную схему, которая соответствует схеме оригинала прибора, а в голове начинающего аналитика слова «прибор X» вызывают пустой образ или некоторый черный ящик с ручками.



Рис. 3.13. Неоднозначность интерпретации

Внимание к лингвистическому аспекту проблемы извлечения знаний способствует сближению образа 1 с образом 2 и интерпретации 11 с интерпретацией 12, а слова «прибор X» перейдут в действительно «общий» код.
Таким образом, слой S21 включает изучение и управление процессом разработки специального промежуточного языка, необходимого для взаимодействия инженера по знаниям и эксперта.

Понятийная структура (S22)
Проблемы формирования понятийной структуры представляют следующий слой S22 лингвистического аспекта проблемы извлечения знаний. Особенности формирования понятийной структуры обусловлены установленным постулатом когнитивной психологии о взаимосвязи понятий в памяти человека и наличии семантической сети, объединяющей отдельные термины во фрагменты, фрагменты в сценарии и т. д. Построение иерархической сети понятий, так называемой «пирамиды знаний», — важнейшее звено в проектировании интеллектуальных систем.
Большинство специалистов по искусственному интеллекту и когнитивной психологии считают, что основная особенность естественного интеллекта и памяти в частности — это связанность всех понятий в некоторую сеть. Поэтому для разработки базы знаний и нужен не словарь, а «энциклопедия» [Шенк, Бирнбаум, Мей, 1989], в которой все термины объяснены в словарных статьях со ссылками на другие термины.
Таким образом, лингвистическая работа инженера по знаниям на данном слое проблем заключается в построении таких связанных фрагментов с помощью «сшивания» терминов. Фактически эта работа является подготовкой к этапу концептуализации, где это «шитье» (по Шенку — КОП, концептуальная организация памяти [Шенк, Хантер, 1987]) приобретает некоторый законченный вид.
При тщательный работе аналитика и эксперта в понятийных структурах начинает просматриваться иерархия понятий, подробно о которой будет говориться в параграфах 4.4. и 8.2. Такие структуры имеют важнейшее гносеологическое и дидактическое значение и последнее время для них используется специальный термин — онтологии. Следует заметить, что эта иерархическая организация хорошо согласуется с теорией универсального предметного кода (УПК) [Горелов, 1987; Жинкин, 1982], согласно которой при мышлении используются не языковые конструкции, а их коды в форме некоторых абстракций, что в общем согласуется с результатами когнитивной психологии [Величковский, 1982].
Иерархия абстракций — это глобальная схема, которая может быть положена в основу концептуального анализа структуры знаний любой предметной области. Лингвистический эквивалент иерархии — иерархия понятий, которую необходимо построить в понятийной структуре, формируемой инженером по знаниям (рис. 3.14).

Рис. 3.14. Пример иерархии

Следует подчеркнуть, что работа по составлению словаря и понятийной структуры требует лингвистического «чутья», легкости манипулирования терминами и богатого словарного запаса инженера по знаниям, так как зачастую аналитик вынужден самостоятельно разрабатывать словарь признаков. Чем богаче и выразительнее получается общий код, тем более полнее база знаний.
Аналитик вынужден все время помнить о трудности передачи образов и представлений в вербальной форме. Полезными тут оказываются свойства многозначности слов естественного языка. Часто инженеру по знаниям приходится подсказывать слова и выражения эксперту, и такие новые лексические конструкции оказываются полезными.
Способность к словесной интерпретации зависит и от пола аналитика (параметр s1_1). Установлено, что традиционно женщины придают большую значимость невербальным компонентам общения, а в вербальных имеют более обширный алфавит признаков. И вообще, существуют половые различия восприятия не только в бытовой сфере, что очевидно, но и в профессиональной. Следовательно, у эксперта-мужчины и у эксперта-женщины могут существенно отличаться алфавиты для вербализации признаков воспринимаемых объектов.

Словарь пользователя (S23)
Лингвистические результаты, соотнесенные к слоям общего кода и понятийной структуры, направлены на создание адекватной базы знаний. Однако часто профессиональный уровень конечного пользователя не позволяет ему применить специальный язык предметной области в полном объеме.
Неожиданными для начинающих разработчиков являются проблемы формирования отдельного словаря для создания дружественного интерфейса с пользователем ЭС, исследуемые в слое S23. Необходимы специальные приемы, увеличивающие «прозрачность» и доступность системы. Для разработки пользовательского интерфейса требуется дополнительная доработка словаря общего кода с поправкой на доступность и «прозрачность» системы.
Так, при разработке экспертной системы по психодиагностике АВТАНТЕСТ [Гаврилова, 1984] пришлось разработать два словаря терминов — один для психологов-профессионалов, второй — для неспециалистов (испытуемых). Поскольку результат психодиагностического тестирования всегда интересен испытуемому, ему выдается листинг с психологическим заключением на общелитературном языке без употребления специальных терминов. Интересно, что при внедрении системы использовался в основном этот второй словарь; даже профессиональные психологи предпочитали получать тексты на обыденном языке.

3.3.3. Гносеологический аспект извлечения знаний

Гносеология — это раздел философии, связанный с теорией познания, или теорией отражения действительности в сознании человека. Гносеологический аспект (A3) извлечения знаний объединяет методологические проблемы получения нового научного знания, поскольку при создании БЗ эксперт часто впервые формулирует некоторые закономерности, до того момента составлявшие его личный опыт.
Инженерия знаний как наука, если можно так выразиться, дважды гносеологична — сначала действительность (О) отражается в сознании эксперта (M1), а затем деятельность и опыт эксперта интерпретируются сознанием инженера по знаниям (М2), что служит уже основой для построения третьей интерпретации (Р) — поля знаний экспертной системы (см. рис. 3.5). Процесс познания, в сущности, направлен на создание внутренней репрезентации окружающего мира в сознании человека.
Предметом данного учебника являются в основном процессы отображения 12 и 13 (I1 — изучают психология и философия); подробно интерпретация 13 будет рассмотрена далее.
Если описать процессы I2 и I3 в терминологии, введенной в главе 1, то мы имеем дело с превращением экспертного знания и теоретического (книжного) опыта Z1 в поле знаний Z2, которое есть материализация модели мира М2 инженера по знаниям.
В процессе извлечения знаний аналитика в основном интересует компонент Z1, связанный с неканоническими индивидуальными знаниями экспертов, поскольку предметные области, требующие именно такого типа знаний, считаются наиболее восприимчивыми к внедрению экспертных систем. Эти области обычно называют эмпирическими, так как в них накоплен большой объем отдельных эмпирических фактов и наблюдений, в то время как их теоретическое обобщение — вопрос будущего.
Если считать, что инженер по знаниям извлекает только фрагмент Z1', то есть часть из системы знаний эксперта Z1, то его задача, во-первых, стараться, чтобы структура Z1' соответствовала Z1, и, во-вторых, чтобы Z1' как можно более полно отражал Z1.
Познание часто сопровождается созданием новых понятий и теорий. Иногда эксперт порождает новые знания прямо в ходе беседы с аналитиком. Такая генерация знаний полезна и самому эксперту, который до того момента мог не осознавать ряд соотношений и закономерностей предметной области. Аналитику может помочь тут и инструментарий системной методологии, позволяющий использовать известные принципы логики научных исследований, понятийной иерархии науки. Эта методология заставляет его за частным всегда стремиться увидеть общее, то есть строить цепочки.

Не всегда удается дойти до последнего звена этой цепочки, но уже само стремление к движению бывает чрезвычайно плодотворным. Такой подход полностью согласуется со структурой самого знания, которое имеет два уровня:
1. Эмпирический (наблюдения, явления).
2. Теоретический (законы, абстракции, обобщения).
Но теория — это не только стройная система обобщения научного знания, это также некоторый способ производства новых знаний. Основными методологическими критериями научности, позволяющими считать научным и само новое знание и способ его получения, являются [Коршунов, Манталов, 1988]:
A3 = {S31, S32, 533} = {внутренняя согласованность, системность, объективность, историзм}.

Внутренняя согласованность(S31)
Основные характеристики эмпирического знания:
S31 = {s31_i} = {модальность, противоречивость, неполнота}.
На первый взгляд критерий внутренней согласованности знания не соответствует реальным характеристикам, описывающим знания с точки зрения слоя s31_i. Эти характеристики эмпирических знаний подчеркивают его «многоуклад-ность» — столь часто факты не согласуются друг с другом, определения противоречат, критерии диффузны и т. д. Аналитику, знающему особенности эмпирического знания, — приходится сглаживать эти «шероховатости» эмпирики.
Модальность (s31_1) знания означает возможность его существования в различных категориях, то есть в конструкциях существования и долженствования. Таким образом, часть закономерностей возможна, другая обязательна и т.д. Кроме того, приходится различать такие оттенки модальности, как:
• эксперт знает, что...;
• эксперт думает, что...;
• эксперт хочет, чтобы...;
• эксперт считает, что... .
Возможная противоречивость (s31_2) эмпирического знания — естественное следствие из основных законов диалектики, и противоречия эти не всегда должны разрешаться в поле знаний, а напротив, именно противоречия служат чаще всего отправной точкой в рассуждениях экспертов.
Неполнота (s31_3) знания связана с невозможностью полного описания предметной области. Задача аналитика эту неполноту ограничить определенными рамками «полноты», то есть сузить границы предметной области либо ввести ряд ограничений и допущений, упрощающих проблему.

Системность (S32)
Системно-структурный подход к познанию (восходящий еще к Гегелю) ориентирует аналитика на рассмотрение любой предметной области с позиций закономерностей системного целого и взаимодействия составляющих его частей. Современный структурализм исходит из многоуровневой иерархической организации любого объекта, то есть все процессы и явления можно рассматривать как множество более мелких подмножеств (признаков, деталей) и, наоборот, любые объекты можно (и нужно) рассматривать как элементы более высоких классов обобщений. Например, системный взгляд на проблематику структурирования знаний позволяет увидеть его иерархическую организацию. Подробнее об этом в параграфе 3.4.

Объективность (S33)
Процесс познания глубоко субъективен, то есть он существенно зависит от особенностей самого познающего субъекта. «Факты существуют для одного глаза и отсутствуют для другого» (Виппер). Таким образом, субъективность начинается уже с описания фактов и увеличивается по мере углубления идеализации объектов.
Следовательно, более корректно говорить о глубине понимания, чем об объективности знания. Понимание — это сотворчество, процесс истолкования объекта с точки зрения субъекта. Это сложный и неоднозначный процесс, совершающийся в глубинах человеческого сознания и требующий мобилизации всех интеллектуальных и эмоциональных способностей человека. Все свои усилия аналитик должен сосредоточить на понимании проблемы.
В психологии известен результат [Величковский, Капица, 1987], подтверждающий факт, что люди, быстро и успешно решающие интеллектуальные задачи, большую часть времени тратят на понимание ее, в то время как плохие решатели быстро приступают к поискам решения и чаще всего не могут его найти.

Историзм (S34)
Этот критерий связан с развитием. Познание настоящего — есть познание породившего его прошлого. И хотя большинство экспертных систем дают «горизонтальный» срез знаний — без учета времени (в статике), инженер по знаниям должен всегда рассматривать процессы с учетом временных изменений — как связь с прошлым, так и связь с будущим. Например, структура поля знаний и база знаний должны допускать подстройку и коррекцию как в период разработки, так и во время эксплуатации ЭС.
Рассмотрев основные критерии научности познания, попытаемся теперь описать его структуру. Методологическая структура познания может быть представлена как некоторая последовательность этапов [Коршунов, Манталов, 1988].
Параметры {S3i} органически вписываются в эту структуру познания, которая может быть представлена как последовательность этапов, описанных далее с позиций инженера по знаниям:
• Э_1: описание и обобщение фактов;
• Э_2: установление логических и математических связей, дедукция и индукция законов;
• Э_3: построение идеализированной модели;
• Э_4: объяснение и предсказание явлений.

Э_1. Описание и обобщение фактов
Тщательность и полнота ведения протоколов во время процесса извлечения и пунктуальная «домашняя работа» над ними — вот залог продуктивного первого этапа познания и материал для описания и обобщения фактов.
На практике оказывается трудным придерживаться принципов объективности и системности, описанных выше. Чаще всего на этом этапе факты просто собирают и как бы бросают в «общий мешок»; опытный инженер по знаниям часто сразу пытается найти «полочку» или «ящичек» для каждого факта, тем самым подспудно готовясь к этапу концептуализации.

Э_2. Установление связей и закономерностей
В памяти эксперта все понятия увязаны и закономерности установлены, хотя часто и неявно задача инженера — выявить каркас умозаключений эксперта. Реконструируя рассуждения эксперта, инженер по знаниям может опираться на две наиболее популярные теории мышления — логическую и ассоциативную. При этом если логическая теория благодаря горячим поклонникам в лице математиков широко цитируется и всячески эксплуатируется в работах по искусственному интеллекту, то вторая, ассоциативная, гораздо менее известна и популярна, хотя имеет также древние корни. Так, Р. Фейнман в своих «Лекциях по физике» отмечает, что в физике по-прежнему преобладающим является вавилонский, а не греческий метод построения знаний. Известно, что древневосточные математики умели делать сложные вычисления, но формулы их не были логически увязаны. Напротив, греческая математика дедуктивна (например, «Начала» Евклида).
Традиционная логика формирует критерии, которые гарантируют точность, валидность, непротиворечивость общих понятий рассуждений и выводов. Ее основы заложены еще в «Органоне» Аристотеля в 4 в. до н. э. Большой вклад в развитие логики внес Джон Стюарт Милль (1806-1873).
Инженер по знаниям и сам использует операции традиционной логики и выделяет их в схеме рассуждений эксперта. Это следующие операции:
• определение;
• сравнение и различение;
• анализ;
• абстрагирование;
• обобщение;
• классификация;
• категоризация;
• образование суждений;

<< Предыдущая

стр. 5
(из 26 стр.)

ОГЛАВЛЕНИЕ

Следующая >>