<< Предыдущая

стр. 9
(из 12 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

Бетховен Вегелеру, 16 ноября 1801 г.:
«День и ночь у меня беспрерывный шум и гудение в ушах. Могу сказать, что жизнь моя жалка: уже два года я избегаю всякого общества. Иногда я еле слышу говорящею тихо, правда, я различаю звуки, но не сло­ва; и все же, когда кричат, это для меня невыносимо... Я часто проклинал свое существование... Терпение! Какое жалкое прибежище, но только оно и остается мне».
О глухоте Бетховена очень много писали медики и музыковеды. Медики, профессионально исследовавшие течение болезни, по характерным ее признакам уста­новили, что Бетховен страдал отосклерозом.
Причина потери слуха при отосклерозе состоит в том, что вокруг стремечка, крохотного последнего звена в цепочке слуховых косточек, разрастается кост­ная ткань, сковывающая его основание. Человек слы­шит до тех пор, пока звуковая волна выгывает колеба­ния слуховых косточек. Как только стремечко стано­вится неподвижным, слух угасает. Заболевание отосклерозом возникает обычно в период полового созревания или в ближайшие годы после него и носит хронический характер. Практически здоровый человек в расцвете творческих сил без всякой видимой причи­ны теряет слух. Существенное значение в причинах возникновения этого заболевания придают наследст­венно-конституциональным факторам, звуковой трав­ме, нарушению кровообращения, расстройствам функ­ций эндокринной системы.
До недавнего времени лечение больных отосклеро­зом лекарственными и физиотерапевтическими сред­ствами оставалось малоэффективным. Дело в том, что все они были направлены главным образом на ослаб­ление одного из тяжелых проявлений отосклероза — ощущения шума в ушах. Основной же симптом забо­левания — тугоухость — этими методами устранить не удавалось. На помощь пришла хирургия. И если бы Бетховен жил на полтораста лет позже, советские вра­чи — отоларингологи — излечили бы великого компо­зитора от тяжелого недуга. С 1963 г. лауреаты Ленин­ской премии А. И. Коломийченко, В. Ф. Никитина, Н. А. Преображенский, С. Н. Хечинашвили и К. Л. Хи-лов в разных городах Советского Союза провели сотни операций по поводу отосклероза. Сотням людей, стра­давших тем же недугом, что и Бетховен, возвращен слух.
Но отосклероз, с которым так успешно борются советские врачи, не самое тяжкое расстройство слуха. Известно ведь, что и сам Бетховен мог «слышать», на­пример, игру на рояле, упираясь подбородком в ручку трости, другой конец которой прикасался к инстру­менту. Нервные окончания, воспринимающие звуковые раздражения, функционировали нормально, и поэтому механические колебания, проходя через кости черепа, воздействовали на жидкость внутреннего уха — компо­зитор «слышал».
А как помочь людям с так называемым невритом, развивающимся вследствие нарушения нормальной дея­тельности самих нервных окончаний, воспринимающих звуковые раздражения? Частичное ослабление слуха можно в известной степени компенсировать, применив обычный аппарат для тугоухих. А если все окончания не функционируют, если связь уха с мозгом нарушена полностью и человек не слышит ни с аппаратом, ни без него?
Недавно в США произошел случай, указавший вра­чам путь облегчения этого заболевания. Два человека жаловались всем по очереди невропатологам своего города на странный недуг. Время от времени оба слы­шали голоса людей, которые рекомендовали им купить

то холодильник, то мыло, то последнюю модель элект­робритвы «Ротошейв». В интервалах между уговорами звучала музыка, которая в других обстоятельствах могла бы нравиться,— дело в том, что «голоса» были слышны тогда, когда к испуганным людям никто не об­ращался, а музыка — когда никто из окружающих ее не слышал.
Усилитель и приемник 6 зубе
Усилитель Зубтя Зттв Кристш ' Иердные

Врачи были в недоумении — никаких психических расстройств у пациентов не обнаружилось. А между тем они продолжали утверждать, что слышат голоса.
Ммозгу




Рис. 2. Схема «радиозуба».

Наконец, нейрофизиолог доктор Пухарик обратил внимание на то, что оба больных недавно лечили зубы у одного и того же зубного врача по фамилии Лоуренс. Обратились к нему, и стоматолог сказал, что он за­пломбировал обоим зубы цементом особого состава: в нем была незначительная примесь карборунда.
Постепенно все объяснилось. Кристаллы карборун­да — типичного полупроводника — детектировали сиг­налы местной коротковолновой станции, передававшей торговую рекламу, на которую волей случая оказались «настроенными» зубы, запломбированные цементом с полупроводящей примесью. Низкочастотные колеба­ния воспринимались живым нервом зуба и передавались в мозг.
Так был найден способ использования нервных окончаний зубов (об их связи со слуховыми центрами мозга было давно известно) для восстановления слуха у больных невритом. Лоуренс и Пухарик обратились за помощью к радиоинженерам. Совместными усилия­ми был создан «радиозуб» — система, с помощью ко­торой сегодня слышат уже несколько человек (рис. 2).
Миниатюрный микрофон, который можно носить на руке, как часы, связан с таким же миниатюрным пе­редатчиком, преобразующим звуки в радиосигналы. Последние улавливает приемник, вмонтированный в зуб. Ничего удивительного в этом нет, если учесть, что приемник представляет собой тонкий слой полу­проводникового сплава, наложенного на свободные нервные окончания в зубе. Этот полупроводниковый сплав образует пьезоэлектрический элемент. Сверху он покрыт слоем золота или серебра, который служит ан­тенной.
Сигнал радиопередатчика, принятый такой антен­ной, попадает в пьезоэлемент. В нем возникают коле­бания, которые, возбуждая свободные нервные оконча­ния в зубе, передаются в виде нервных импульсов в слуховые центры мозга. И человек, который до сих пор жил в мире без звуков, начинает слышать.
Совсем иначе подошли к проблеме моделирования слуха израильские ученые. Они работают над создани­ем «телефона» совершенно нового типа, который дол­жен дать возможность глухонемым общаться друг с другом.
Система состоит из передатчика, снабженного кла­виатурой с пятью клавишами, манипулируя которыми можно получать различные частоты, и приемника с ди­афрагмой, позволяющей воспринимать вибрации конца­ми пальцев. В настоящее время задача состоит в том, чтобы разработать рациональный метод кодирования колебаний простой и сложной формы. Код, построен­ный всего на трех частотах, позволяет создать словарь из 5000 слов.
Пока ведутся психологические исследования: выра­батывается скоростной метод чтения колебаний, опреде­ляется время, которое потребуется на обучение коду, и т. д. Кроме того, израильские ученые считают, что связь с космонавтами может быть осуществлена при по­мощи этого «телефона» с большей четкостью, так как часто случается, что при передаче человеческий голос сильно искажается.
В радиозубе американских ученых электромагнитные колебания превращаются пьезоэлектрическим преобра­зователем в механические — размеры самого пьезоэлек­трического преобразователя определяются амплитудой несущей радиочастоты, промодулированной звуковым сигналом. «Вибрирующий» пьезоэлемент по-разному да­вит на нервные окончания в зубе, связанные со слухо­выми центрами мозга, — возникает слуховое ощущение. А может ли ухо непосредственно воспринимать элек­тромагнитные колебания?
Проделайте такой опыт. Возьмите крышку от алю­миниевой кастрюли, присоедините к ее ручке провод и вставьте его в одно из гнезд радиотрансляционной розетки. Приложите крышку к уху и пальцем свобод­ной руки прикоснитесь к другому гнезду розетки. Вы услышите передачу.
В чем же здесь дело?
Ухо, а вернее, барабанная перепонка, с одной сто­роны, и крышка от кастрюли — с другой, представляют собой две обкладки конденсатора, на который по руке и проводу подается переменное напряжение звуковой частоты. Происходящие при этом явления описаны в разделе «Электричество» школьного курса физики. При увеличении напряжения на обкладках конденса­тора увеличивается усилие, стремящееся их сбли­зить,— барабанная перепонка выгибается в сторону крышки. Когда напряжение уменьшается, перепонка стремится вернуться в первоначальное положение. Та­ким образом, сравнительно просто создать условия, при которых человек может «слышать» изменения напря­жения.
К счастью для человека, из всех видов колебаний, распространяющихся в воздухе, человек воспринимает только свет и звук. Если бы человек ощущал электро­магнитные волны любой частоты, то мир, в котором он живет, стал бы для него еще более беспокойным. Од­нако именно в таком мрачном мире начала жить с I960 г. домашняя хозяйка из Санта-Барбара. Перебрав­шись в свой новый дом, госпожа Г. (она предпочла, чтобы ее фамилия осталась неизвестной) начала жало­ваться врачам на то, что ее преследует во всех комна­тах шум, который никто, кроме нее, не слышит. Док­тора, приняв это за галлюцинацию, стали лечить госпо­жу Г. от обычного психоза, но ей ничего не помогало. По виду вполне здоровая, психически уравновешен­ная, рассудительная женщина начала было и впрямь сомневаться в своем психическом здоровье. О «болез­ни» госпожи Г. узнал Кларенс Уиски, научный сотруд­ник Калифорнийского университета. Специалист по контрольно-измерительной аппаратуре, Уиски решил провести исследования загадочного явления. Отпра­вившись в «наполненную странными звуками» обитель госпожи Г., ученый с помощью чувствительных прибо­ров быстро обнаружил, что в новом доме возникают электромагнитные поля, порождаемые, по-видимому, некоторыми особенностями в конструктивном офор­млении электрической, водопроводной, газовой, отопи­тельной, телефонной и радиосети. Не говоря никому о своей догадке, Уиски записал эти обычно неслыши­мые сигналы на магнитную пленку и затем «проиграл» ее госпоже Г. «И вы хотите сказать, что ничего не слышите?» — удивленно воскликнула она. Уиски дей­ствительно ничего не слышал, но это не убедило его в сверхъестественных способностях госпожи Г. Чтобы окончательно разобраться в мучивших его сомнениях, ученый сконструировал устройство, воспроизводившее в общих чертах те же электромагнитные явления, ко­торые наблюдались в доме госпожи Г., и позаботился о том, чтобы всю аппаратуру можно было включать совершенно незаметно. Как только аппаратура начина­ла работать, госпожа Г. тотчас же начинала жаловать­ся на слышимые ею шумы. Она также жаловалась на то, что временами слышит сигналы азбуки Морзе вы­сокого тона. Оказалось, что эти сигналы посылала расположенная поблизости радиостанция.
О результатах своих исследований Уиски недавно доложил на конференции специалистов по биологиче­ской и медицинской аппаратуре в Лос-Анжелосе. Но сообщение о том, что жительница штата Калифорния способна «слышать» электромагнитные излучения, было принято недоверчиво. Однако на этой же конференции выступил другой ее участник — доктор Аллан Фрей, психолог, который специально изучал влияние электро­магнитных полей на психофизиологическое состояние человека.
«Действительно, — подтвердил он,— эксперименты показали, что при воздействии сверхвысокочастотными колебаниями в диапазоне от 200 до нескольких тысяч мегагерц некоторые нормальные и глухие люди слышат звуки. В зависимости от длительности импульсов и частоты их повторения сверхвысокочастотные сигналы воспринимались испытуемыми как жужжание, писк, шипение или стук. В проведенных экспериментах им­пульсы СВЧ не несли никакой информации. Что же ка­сается механизма восприятия, то я его объяснить не могу».
Зарубежные комментаторы объясняют чрезмер­ную скромность доктора Фрея тем, что он, в отличие от Уиски, работает по заданию военно-морского ведом­ства США. Имеются данные, что в настоящее время продолжаются работы по изучению обнаруженного феномена с целью его использования в дальнейшем для передачи информации.
Совершенно очевидно, что в рассмотренном случае в организме людей происходят явления, значительно отличающиеся от тех, которые обеспечивают нормаль­ное звуковое восприятие: ведь сверхвысокочастотное излучение «слышат» некоторые глухие! Здесь уместно напомнить, что звуковой анализатор человека с нор­мальным слухом в нормальных условиях воспринимает только колебания воздуха — сжатия и разрежения про­дольной воздушной волны, распространяющейся от звучащего предмета, причем он воспринимает их толь­ко в том случае, если частота этих колебаний не пре­вышает 20 ООО гц. Природа, совершенствовавшая дли­тельное время человеческий слух, видимо, решила, что слышать более высокие частоты нам ни к чему. А вот слуховой аппарат сов природа наделила способностью воспринимать ультразвуки, издаваемые грызунами. Максимальная частота, которую еще слышат совы, примерно равна 30 кгц. Пользуясь своим слуховым аппаратом, даже слепые совы великолепно ориенти­руются в пространстве. Их ушная раковина — акусти­чески совершенный рупор — усиливает попадающий на нее звук перед тем, как сфокусировать его на барабан­ную перепонку.
И тем не менее существуют животные, у которых ушной раковины нет совсем, да и сам орган слуха уж очень не похож на человеческий.
«Уши» насекомых, например, расположены в очень неподходящих для этого местах (с точки зрения че­ловека). Знаете, где уши у паука? Настоящих ушей у него, правда, нет, но он все же может слышать. В до-

полнение к восьми глазам у пауков есть еще высоко­чувствительные органы слуха на лапках (рис. 3). Уг­лубление в хитиновом скелете заменяет ему нашу ушную раковину. Слуховой орган, расположенный около ножного сустава, открывается и закрывается в от­вет на звуки и вибрацию.
Несмотря на кажущуюся простоту, органы слуха насекомых способны воспринимать звуки в чрезвычай­но широком диапазоне частот. В ухе ночной бабочки,








Рис. 3. Ухо паука (показано стрелкой).

например, имеется всего три нервных волокна, но оно обнаруживает ультразвуки, издаваемые летучей мышью. Слуховой орган моли воспринимает частоты от 10 до 100 кгц и позволяет обнаруживать приближение лету­чих мышей на расстоянии до 30 м. «Ухо» моли настоль­ко совершенно и настолько чувствительно, что его ис­пользовали для приема сигналов, посылаемых летучи­ми мышами. Для этой цели к нервным волокнам, идущим от слухового органа моли, присоединяли ми­ниатюрные электроды; электрические сигналы милли-секундной длительности, снимаемые со «слухового выхода», записывали на магнитную ленту и затем соот­ветствующим образом обрабатывали для выяснения ко­личества информации, получаемой молью о движении летучей мыши. Работы, проведенные Центром исследо­ваний и разработок ВВС США в Кембридже, показали,

15 И. Б. Лятявецквй
449

что два элемента, образующие слуховой орган моли, раз­личаются по чувствительности на 20 — 25 дб.
Немало споров вызвал вопрос о слухе земноводных. Некоторые ученые даже утверждали, что они глухи и не способны воспринимать звуки, которые сами про­изводят. В действительности же последние исследова­ния по нейрофизиологии доказали, что земноводные слышат, но их слух нельзя сравнивать ни со слухом рыб, ни со слухом наземных млекопитающих. Возмож­но, что некоторое количество вибраций передается не прямо в наружное ухо, а доходит до внутреннего уха кружным путем, через все тело. Некоторые жабы луч­ше воспринимают звук, когда их слуховые органы наполовину погружены в воду. Прерывистые звуки они слышат лучше, чем непрерывные. Впрочем, разные виды земноводных слышат по-разному, так что какие бы то ни было обобщения здесь затруднительны. Одна­ко несомненно, что обстоятельное изучение органов слуха животных и прежде всего слухового аппарата человека будет способствовать созданию электронных систем, обладающих принципиально новыми свойст­вами.
Уже одно достижение такой чувствительности у приборов, улавливающих звук, какой характеризуется человеческое ухо, безусловно, имело бы огромное зна­чение для разработки целой гаммы важнейших научно-технических приборов и устройств. Ведь энергетиче­ский порог чувствительности нашего уха в 10 раз выше, чем у глаза! Об исключительно высокой чувствительно­сти слухового анализатора человека можно судить по следующим данным. Люди с острым слухом восприни­мают звук при звуковом давлении в слуховом проходе, примерно равном 0,0001 дин/см2, что соответствует пе­ремещению элементов улитки уха на величину поряд­ка 10˜и см. Это в 1000 раз меньше диаметра атома во­дорода! Разрешающая способность человеческого уха также весьма велика. Достаточно сказать, что люди с хорошо развитым слухом могут отличить звук часто­той 1000 гц от звука частотой 1001 гц. Отсюда следует, что чувствительность уха человека близка к абсолютной границе различения. Добиться подобной чувствительно­сти технических приборов и систем было бы весьма по­лезным.
В последнее время в ряде стран получили широкий размах исследования так называемого квазислухового опознавания, имеющие целью создание устройств, мо­делирующих слуховой аппарат. Исследования органов слуха проводятся главным образом в следующих на­правлениях:
механизм обработки акустической информации;
акустические сервомеханизмы;
конструктивные особенности органов слуха.
Кроме того, проводится математическое моделиро­вание органов слуха. Некоторые устройства, воспроиз­водящие функции органов слуха, уже созданы и испы­таны. Так, в Лейденском университете в связи с иссле­дованием механизма восприятия звуков человеком раз­работана электронная модель уха (в виде системы фильтров), воспроизводящая частотные характеристики уха. Моделирование позволило уточнить механизм слу­ха и, в частности, объяснить такие явления, как восприя­тие тембра и звуков в их динамике. Одна зарубежная фирма создала электронную модель уха, обеспечиваю­щую, подобно человеческому уху, различение слабых сигналов на фоне шумов за счет корреляционного про­цесса. Другая разработала модель внутреннего уха, где используются аналоги нейронов — нейромимы.
Интересная разработка выполнена сотрудниками Ленинградского электротехнического института связи имени проф. Бонч-Бруевича. Они создали систему, по­лучившую название «электронное ухо». Электронный прибор определяет, насколько хорошо звучат музы­кальные инструменты. Для оценки качества звучания гитары устройству требуется меньше минуты, тогда как весьма компетентный экспертный совет затрачивает на это несколько часов. «Электронное ухо», как опытный педагог-музыкант, выводит инструменту «отметку» по пятибалльной системе.
Уже первый опытный экземпляр «электронного уха» позволил организовать своеобразный «конкурс ушей». Гитарист за занавесом по нескольку раз исполнял спе­циально составленную программу. «Электронное ухо» работало параллельно с советом экспертов. Эксперты-музыканты ставили оценки, на основе которых каждому инструменту был выведен средний балл. Когда их срав­нили с оценками прибора (эксперты до этого ничего

не знали об оценках, поставленных «электронным ухом» тому или иному инструменту), получилось пол­ное соответствие.
Детекти­рующий шлитель
ни)
Ряд удачных моделей уха создан фирмами и учебны­ми заведениями США. Примером может служить анало­говая модель уха, разработанная американскими учены­ми В. Колдуэллом, Э. Глессером, Дж. Стюартом. Модель предназначена для анализа зависимости интен­сивности звучания разных частот в произносимых

ШеЯисилитель

Рвюмсный




мшфофонного или магнито-/ртною бхаоо

усилитель, шагирутци, среднее ухо

Усилитель мощности

Модели улитки

Детекти­рующий усилитель

Детекти­рующий усилитель


Су
Осцил-
t
Ралошющее

Рис. 4. Блок-схема аналоговой модели уха (по В. Кол­дуэллу, Э. Глессеру, Дж. Стюарту).

человеком звуках от времени с целью выявления при­знаков, по которым человек опознает звуки, фонемы и слова, произнесенные разными людьми. Блок-схема устройства показана рис. 4.
Из рисунка ясно, что блоки системы точно воспро­изводят функции, которые выполняют разные части человеческого уха. Так, входной предусилитель моде­ли играет роль ушной раковины, которая усиливает звук, передаваемый ею на барабанную перепонку. Вто­рой каскад выполняет функцию среднего уха.
Почему человек не слышит звуков, частота которых превосходит 20 кгц1 Потому что колебания такой ча­стоты очень плохо воспроизводятся барабанной пере­понкой и слуховыми косточками. Дело в том, что эти части уха слишком тяжелы и не успевают колебаться вслед за слишком «быстрыми» ультразвуковыми коле­баниями. Иначе говоря, амплитуда ультразвуковых ко­лебаний «на выходе» из среднего уха равна нулю. Но те же слуховые косточки плохо передают низкие частоты в несколько герц — колебания получаются слишком медленными и очень слабыми. Таким обра­зом, среднее ухо работает так же, как обычный узкопо­лосный (резонансный) усилитель, более или менее оди­наково усиливающий колебания в диапазоне от не­скольких герц до 20 кгц (второй каскад блок-схемы). «Усилителем мощности», рассеиваемой в улитке уха (третий каскад блок-схемы), служит вся гидравличе­ская система улитки, в которой создается давление на чувствительные элементы (оно должно быть достаточ­ным для четкого восприятия звука). Модель улитки представляет собой линию с распределенными R, L, С, к разным точкам которой подключены «чувствитель­ные элементы» — усилители. В разных точках аналога улитки (линии с распределенными параметрами), к ко­торым подключены усилители, звуковой сигнал звучит по-разному. Исследователей интересовали только вели­чины его амплитуд в разных точках, а не частоты; по­этому усилители (они же чувствительные элементы) еще детектировали усиливаемый сигнал, так что на экране осциллографа изображалась по очереди форма огибающих сигнала, соответствовавшая разным часто­там. Очередность подачи на вход осциллографа сигна­лов с разных точек «улитки» обеспечивал коммутатор. Аналогичного устройства в ухе нет, но предполагается, что сигналы возбуждения, передаваемые нервными во­локнами, претерпевают в мозге весьма сложную ком­мутацию: «оттуда — сюда, отсюда — туда».
Результаты исследования «звуковых узоров», вос­производимых моделью на экране осциллографа, полу­чились весьма неожиданными. Оказалось, что «узоры», соответствующие одному и тому же звуку или фоне­ме, произносимым одним человеком, зачастую совер­шенно непохожи друг на друга. Например, при 100 пов­торениях буквы I (ай) одним и тем же лицом получа­лось 30 различных картин. Так что мозг и слуховой аппарат человека производят поистине титаническую работу, отыскивая признаки, по которым можно опре­делить (и действительно определяют!), что слово «био­ника», произнесенное гнусавым басом и свистящей фи­стулой,— одно и то же слово.
Способность человеческого мозга разбираться с по­мощью слухового аппарата в джунглях звуков, выде­лять из кажущегося хаоса значимые формы является одним из его самых чудесных свойств. В раскрытии это­го свойства, его моделировании ныне кровно заинтере­сована бионика, пытающаяся внести свой посильный вклад в решение одной из важнейших современных проблем, которую кратко именуют «человек— машина».
Представьте себе такую гипотетическую ситуацию.
Скорпя помощь привезла в больницу тяжелобольно­го. Человека положили на операционный стол. Поло­жение чрезвычайно серьезное, дорога буквально каж­дая секунда: хирург должен сейчас, сию минуту при­нять решение, а диагноз заболевания еще далеко не ясен. Остается одно — обратиться за помощью к имею­щейся в больнице диагностической вычислительной ма­шине, в «памяти» которой накоплен огромный опыт врачей многих стран и поколений. За доли секунды она может «просмотреть» тысячи историй болезни, найти аналогии и на основе их анализа поставить абсолютно точный диагноз. И даже дать рекомендации по лече­нию. Хирургу нужно задать всего лишь один вопрос своему электронному консультанту. Только машина может дать единственно правильный ответ, и она может сообщить его почти мгновенно. Получив точный диаг­ноз, выиграв время, можно приступать к операции...
Но... Существующие сейчас электронные вычисли­тельные машины, находящиеся на вооружении про­мышленных предприятий, научно-исследовательских ор­ганизаций, больниц и клиник, глухи и слепы! Всю информацию они собирают на ощупь, с продырявлен­ных — перфорированных — карточек и лент. С элек­тронными вычислительными машинами мы разговари­ваем не на своем языке, не так, ках удобно нам, а так, как удобно им, машинам. Здесь принята сложная систе­ма программ, специальных машинных языков. Машин­ный язык — язык цифр. Какую бы задачу, вычислитель­ную или логическую, ни решала бы быстродействующая электронная вычислительная машина, она совершает операции над цифрами и только над ними. Тысячи ма­тематиков и программистов заняты составлением алго­ритмов и программ для машин, или, иными словами, переводом рабочих заданий с языка человеческого на язык машинный. Представьте себе бригаду землекопов, насыпающих по лопатке ковш гигантского экскавато­ра,—нечто подобное происходит и в современных вы­числительных центрах. В нашем же конкретном случае вопрос хирурга попадет в диагностическую машину не раньше чем через час — время, требуемое для кодиро­вания вопроса и перфорации ленты или карты. А час — это очень много, когда приходится сталкиваться с цейт­нотом в «игре», где ставка — жизнь. Вот и приходится врачу в подобных случаях надеяться лишь на собствен­ный опыт да интуицию.
Таких или подобных ситуаций, когда возможности, заложенные в машинах, не удается использовать из-за трудности общения с ними, можно назвать десятки и сотни. Так как электронные вычислительные машины не понимают нашего языка и не могут на нем гово­рить, не возможны ни разговор с ними по телефону, ни приглашение электронного консультанта на консили­ум, на совещание, где порой приходится оперативно принимать решения по важнейшим техническим и эко­номическим вопросам, на непринужденную беседу с иностранцем, языком которого вы не владеете. Но, по­жалуй, самое главное — разговор с вычислительными машинами совсем не прост, сегодня для этого необхо­димо в совершенстве знать программирование и ма­шинный язык.
Постепенно в науке наметился путь решения этой проблемы: нужно создать машины, понимающие язык человека, такие машины, которые могли бы слышать и понимать услышанное, подчинялись бы буквально каж­дому нашему слову. Создание машин, воспринимающих голосовые команды, значительно облегчило бы деятель­ность человека-оператора, так как отпала бы необходи­мость перекодировки словесно выраженных понятий и команд в сложно координированные акты клавишного или кнопочного управления. Научив машину слушать и понимать нашу речь, мы смогли бы не только улуч­шить обмен информацией между человеком и машиной, но и эффективно использовать последнюю для совер­шенствования контактов между людьми. Как, например, услышать человека, опустившегося на дно моря, как быстро и правильно обучить людей чужим языкам? На все эти вопросы мы могли бы, вероятно, получить ответы у машины, которая научилась бы понимать нас «с полуслова».
Каковы же место и роль бионики в решении пробле­мы «человек — машина»?
В настоящее время обмен информацией между че­ловеком и машиной осуществляется по сравнительно небольшому числу каналов, главным образом посредст­вом выполняемых двигательных актов: нажатием кно­пок, ключа телеграфного аппарата, клавиш, перемеще­нием рычагов, педалей, поворотом рулевого колеса и

Рис. 5. Схема обмена информацией между человеком и машиной
(по В. В. Ларину). А — современное положение дела: человек получает от машины только зрительные и слуховые сигналы и дает машине команды только путем двигательных актов; Б — перспективы расширения поступления информации от машины к человеку и обратно через не используемые сейчас анализаторы (осязание, проприоцептивная чувствительность и т. д.).
т. п. Что же касается информации, поступающей от машины к человеку, то она сводится лишь к звуковым и световым сигналам (включение различных табло, цифровая индикация). Между тем возможности связи человека с машинами значительно обширнее, чем это имеет место сейчас (рис. 5). Достаточно напомнить, что, кроме зрения и слуха, человек обладает обоняни­ем, осязанием, вкусом, а также проприоцептивной чув­ствительностью. Все эти входы живой системы — чело­века — могут весьма успешно использоваться для ввода в машину самой разнообразной информации. И биони­ка идет именно по этому пути. В целях обеспечения наилучшего общения человека с машиной бионика пы­тается широко использовать биологические принципы в технике. Иными словами, в отличие от кибернетики и инженерной психологии, пытающихся разработать опти­мальные методы использования человеческих возможно­стей для управления сложнейшими техническими систе­мами, бионика идет по пути улучшения связи человека с машиной не за счет рационализации человеческих ка­честв, а за счет «биологизации» машин. Примером мо­жет служить проводимая в настоящее время работа по созданию «слышащих» машин.
Такую машину нужно прежде всего снабдить отлич­ным слуховым аппаратом. Это задача, так сказать, но­мер один. Но услышать сообщение — распознать «слу­ховые образы» — еще полдела. Нужно также научить машину «понимать» его смысл — в противном случае автомат превратится в некое кибернетическое подобие гоголевского Петрушки, который, как известно, отли­чался тем, что все читал с равным вниманием. Его ув­лекал сам процесс чтения: «... что вот-де из букв веч­но выходит какое-нибудь слово, которое иной раз черт знает что и значит». «Научить» машину «понимать» человеческую речь — задача номер два. Обе задачи не­отделимы друг от друга — это типичные бионические проблемы.
Итак, бионический аспект рассматриваемой нами проблемы «человек — машина» («человек — автомат») заключается в поиске новых путей для построения ма­шин (автоматов), наилучшим образом согласованных с человеком-оператором. Задача состоит в создании своеобразного симбиоза человека и машины, т. е. такой их кооперации, при которой машина будет выполнять устные команды, заданные инструкции или выдвигать гипотезы и доказывать их, а человек — оценивать их и давать новые распоряжения или инструкции. Процесс общения человека с машиной нельзя разделять. Для достижения этого нужно усовершенствовать (формали­зовать) обычный язык так, чтобы каждое сообщение че­ловека при его связи с машиной имело для нее опре­деленный логический вес. В этом направлении уже по­лучены некоторые результаты.
По сообщениям американской печати, датированным январем 1962 г., в Корнельском университете был раз­работан первый перцептрон «Тоберморей», способный «опознавать» произносимые слова. Система памяти это­го экспериментального перцептрона содержала около 1000 ячеек, а электроакустический преобразователь (микрофон с последующей записью на магнитную лен­ту) принимал до 1600 отдельных акустических сигналов. Почти одновременно или немного позднее сотрудники Иллинойского университета разработали динамический преобразователь сигналов для выделения инвариантов, т. е. неизменных частотных составляющих, служащих основой данного звука речи. Этот прибор содержит систему фильтров и дифференцирующих цепей, при помощи которых производится разложение звуков на частотные составляющие и выделение инвариантов. Соз­датели прибора считают, что он может быть использо­ван для разработки системы автоматического опозна­вания слов, а также для предварительной обработки данных в адаптивных системах.
Значительная и даже, пожалуй, основная часть ис­следований, проводимых в США в области распознава­ния речи, посвящена созданию квазислуховых автоматов для военных целей. Так, по контракту с Министерст­вом обороны США одна фирма разработала «обучаю­щуюся» машину «Кибертрон» типа К-100, предназна­ченную для распознавания сигналов гидролокационного устройства. Процесс самообучения проводится путем сравнения записей на перфоленту блока памяти сиг­налов, создаваемых звуколокационным устройством, с последующей записью других сигналов, например сиг­налов, создаваемых надводным кораблем, которые по своему частотному спектру близки к сигналам от под­водных лодок. Машина сравнивает эти сигналы и выдает ответ. Процесс повторяется до тех пор, пока ответ не будет правильным. Обученная таким образом система, по сообщениям американской печати, обеспечивает бы­строе и правильное распознавание шумов подводных лодок с ошибкой не большей, чем у самого опытного оператора гидролокационной станции. Кроме машины типа К-100 фирма разработала другой вариант — «Ки­бертрон» типа К-200, предназначенный для распознава­ния слов английской речи.
Сегодня оператору и диспетчеру приходится не только наблюдать; но и активно вмешиваться в произ­водственные процессы, регулировать, управлять ими. В таких случаях управление голосом могло бы сущест­венно облегчить работу. Учитывая это, в нашей стране и за рубежом в последние годы разработан ряд уст­ройств, срабатывающих при произнесении заранее определенных командных слов. Так, например, несколь­ко лет назад в Институте электроники, автоматики и телемеханики Грузинской ССР была создана экспери­ментальная тележка несколько необычной формы. Уче­ные научили ее выполнять 7 слов-команд. Как удалось им достичь этого? Если одно и то же слово повторять много раз и притом разными голосами, а затем изучить сделанную запись, то можно найти общие черты, ха­рактерные только для данного слова. Составленная на основе такого исследования схема закладывается в ма­шину. И тогда, принимая через микрофон уже знако­мые ей сигналы, она реагирует на них включением вполне определенных приборов. Повинуясь командам оператора, металлическая тележка срывается с места и послушно движется вперед, поворачивает налево или направо и по сигналу «стоп» мгновенно останавливает­ся. А ведь вместо металлического зверька легко себе представить «понимающих» устные команды-приказы прокатные станы на заводе, работающие в поле трак­торы и любые другие машины.
Интересно отметить и такую деталь: изображение звука так же постоянно для каждого человека, как и отпечатки его пальцев. Криминалисты на Западе уже пытаются использовать это обстоятельство для опозна­ния преступников. А ученые Грузии намерены на этой основе создать машины, выполняющие команды только определенных лиц. В общем, как в сказке: «Сезам, откройся!»
Из литературы известно о создании устройства, производящего по устной команде перестройку радио­приемников на фиксированные волны. Создано также несколько моделей машин для автоматического набора номера телефона голосом. Правда, большинство из них хорошо работает только при настройке на данный го­лос, причем точность набора составляет в этом случае 97—99%, но без настройки она падает до 50—70%.
Изготовлены выключатели, реагирующие на резкие звуковые команды. Оказывается, человеческий голос обладает интересным свойством, называемым «асиммет­рией огибающей». Особенно большой асимметрией обладают гласные звуки. Прибор, основанный на этом свойстве, «слышит» резко сказанные слова или крик и отключает (в случае опасности) двигатели или дру­гие агрегаты. И вот еще что важно: это устройство спо­собно реагировать на речевые сигналы, которые в 20 раз слабее, чем окружающий шум, — шумы не обла­дают асимметрией огибающей.
Один из зарубежных институтов разработал станок с программным управлением. От других подобных кон­струкций этот станок отличается тем, что программу для него составляет электронная счетная машина. Точ­нее, она не составляет программу, а преобразует в понятную для станка цифровую форму команды, отда­ваемые оператором в микрофон (на это уходит всего несколько секунд). Станок, программируемый голосом, позволяет сэкономить время, нужное для перевода ве­личин подачи, глубины резания и т. д. в машинный код,—устройство само выполняет эту работу. Разу­меется, программу можно наговорить и заранее, тогда станок будет обрабатывать деталь сам, без оператора. Конструкторы сделали так, что электронной вычисли­тельной машине «безразлично», каким голосом отдает­ся приказ: громким или тихим, басом или дискантом. Ее не смутит и различная интонация, особенное произ­ношение и даже акцент. На входе устройства, управ­ляющего работой станка, стоит «швейцар». Он про­пускает только самую суть слова (т. е. то, что отлича­ет данную команду от другой, например «два» от «три» и т. д.). А всяческие «украшения» — то, что ученые на­зывают избыточной информацией, — попросту не \ вос­принимаются машиной.
Не так давно на Брюссельской автомобильной выс­тавке демонстрировался автомобиль фирмы «Крейслер», управляемый посредством устных распоряжений. Стар­тер запускал мотор, повинуясь словесному приказу води­теля. Устное распоряжение заставляло машину вклю­чать и выключать сцепление, переключать скорости. Даже повороты водитель совершал, не прикасаясь к рулю (его вовсе не было на машине!), а лишь произ­нося условные сигналы. Объемистый багажник автомо­биля был весь заполнен электронной аппаратурой, среди которой первое место занимало счетно-решаю­щее устройство и «рецепторы», воспринимающие аку­стические сигналы.
При разработке различных устройств, управляемых голосом, не остались забытыми и устройства для космо­навтов. Так как у космонавта, вышедшего в космос из кабины своего корабля, «не хватает рук» для управле­ния индивидуальным ракетным двигателем — он будет занят выполнением различных операций (работа с ин­струментами, кино- и фотокамерами и т. п.), — аме­риканские инженеры разрабатывают электронное уст­ройство, с помощью которого это управление будет осуществляться командами, подаваемыми голосом кос­монавта. Для этого, как полагают конструкторы, будет достаточно 10 команд.
В Институте кибернетики Академии наук УССР, в лаборатории, руководимой В. А. Ковалевским, создана машина, «запомнившая» два десятка слов. Она узнает их почти безошибочно, независимо от того, кто их про­износит. Если учесть, что из двух десятков слов можно составить не одну сотню разнообразных сочетаний, то выходит, что уже сегодня машина в состоянии воспри­нимать несколько сот различных голосовых команд. Спору нет, этого слишком мало, чтобы вести с машиной свободную беседу, но достаточно для того, например, чтобы она могла мгновенно «понять» команду о выходе из какой-либо аварийной ситуации.
Из всего приведенного выше следует, что разработка устройств, управляемых голосом человека, идет в опре­деленном направлении. Однако до сих пор еще не соз­даны устройства для ввода любого речевого сообщения в вычислительные машины. Пока ведутся только науч­ные поиски, эксперименты, ведь совершенно ясно, что поставленная задача много сложнее проблемы опозна­вания зрительных образов. Преодолеть языковую про­пасть между человеком и машиной одним прыжком очень трудно.
Речь состоит из слогов, слов» фраз и т. д. Наимень­шим элементом речи является звук (фонема). С физиче­ской точки зрения звуки речи различаются и частотным составом, и интенсивностью, и продолжительностью. В речи нет четких границ между звуками. Так же как рукописные буквы соединяются друг с другом промежу­точными элементами, звуки речи в словах стыкуются с помощью «переходов» — звуков, которые возникают при перестройке нашего голосового аппарата для произне­сения очередного звука. У разных людей форманты даже одних и тех же гласных звуков несколько разнятся по своей частоте и интенсивности (в детском и женском голосе все форманты несколько выше, чем в мужском). Кроме того, даже у одного и того же человека форманты одного и того же звука заметно различаются в зависи­мости от того, в каком слове произносится звук, удар­ный он или безударный, высок он или низок. Важной характеристикой звуков являются также число и часто­та обертонов. Индивидуальные особенности характери­стик формант, а также присутствие в голосе еще и дру­гих специфических для каждого человека обертонов придают голосу человека неповторимый, присущий только ему одному тембр. Все это многообразие особен­ностей речевого сигнала заставляет ученых идти раз­личными путями в поисках оптимального решения за­дачи распознавания речи.
Долгое время считалось, что в машинную память сле­дует закладывать все признаки, которые в интересую­щем нас образе встречаются чаще всего. Однако при таком статистическом подходе вычислительная машина должна перерабатывать огромное количество сведений о множестве признаков. Но человек никогда не решает так задачу распознавания. Он сразу же выхватывает главное. При этом он выбирает всякий раз особую, час­то очень сложную, но всегда наиболее эффективную тактику отбора. То же происходит и при распознавании речи (устной или письменной). Мы не отыскиваем каждый раз в памяти фонемы, не сличаем их с услышан­ными. Нам достаточно небольшого числа опорных ориентиров (первые звуки, ударение), чтобы понять слово. Мы часто понимаем и с «полуслова». Забывая об этом, машину учили постепенно составлять слова, по­следовательно складывать их из запасенных в памяти фонем. Вот почему, по мнению ряда ученых, практи­чески никто не добился до сих пор большого успеха. Пока есть только машины, слушающиеся небольшого ко-

личества совершенно определенных устных команд, но не машины, в совершенстве «понимающие» речь.
Однако такого мнения придерживаются далеко не все специалисты, занимающиеся проблемой распозна­вания речи. Наоборот, опираясь на свои исследования, они считают, что восприятие слов в нашем мозге про­исходит по фонемам, а наличие автоматизма в приеме объясняется тем, что в памяти человека имеется набор слов и после прихода цепочки фонем (звуков) в мозгу автоматически создается соответствующий образ. «Это явление, — пишет М. А. Сапожков, — аналогично, напри­мер, печатанию на пишущей машинке: машинистка не может точно сказать, какие буквы были ею напечатаны, а при прочтении слова в мозге оно автоматически раз­лагается на буквы, и соответствующие сигналы посту­пают из мозга в пальцы. Следовательно, наиболее ве­роятно, что в мозге происходит опознавание фонем, а уже по ним — узнавание слов по образцам, хранящимся в памяти человека».
А вот Л. А. Чистович, А. В. Кожевников и другие сотрудники Института физиологии имени И. П. Павло­ва считают, «...что фонемы не представлены в акустиче­ском потоке непосредственным образом и в процессе восприятия речи переход от акустического сигнала к символам фонем осуществляется иным, более сложным способом, чем это предполагает гипотеза пофонемного распознавания». Исследования Л. А. Чистович и В. А. Кожевникова показывают, что наша речь разбива­ется совсем не на фонемы, как это представляется мно­гим. Письмо дробится на буквы, поэтому и в устной речи понятия, слова мы привыкли связывать с серией отдельных звуков. Но внутренняя организация устной речи другая: она разбивается не на фонемы, а на слоги. Человек принимает решение о предыдущей фонеме только после анализа последующего звука, т. е.^он дол­жен проанализировать весь слог.
Так как «...слог является той минимальной единицей, на уровне которой возможен переход от акустического сигнала к смыслоразличительным элементам языка», Л. А. Чистович и В. А. Кожевников пытаются организо­вать понимание машинами слов, или, как говорят, «рас­познавание образов речи», исходя из нового принци­па, Они считают, что для машины различительными
4»з
единицами должны были бы служить слоги. Тогда весь непрерывный поток устной речи можно разбить на сло­говые группы и обрабатывать их, основываясь на зву­ках, которыми заканчиваются слоги. Как только начат переход к другому слогу, машина приступает к обра­ботке данных о предыдущем, а затем передает получен­ные результаты в устройство памяти или на выход.
Быть может, следует идти по пути создания устройств, автоматически распознающих целые слова и фразы? О распознавании фраз речь может идти только в очень узком понимании: распознавание некоторых команд. Такой путь опознавания образа целого сообще­ния, по мнению ряда ученых, вполне себя оправдывает в том случае, когда дело идет об автоматизированном распознавании ограниченного набора (до нескольких десятков) команд, состоящих из одного-двух слов. Одна­ко при переходе от ограниченного набора сообщений к общему случаю, когда число возможных речевых сооб­щений можно принять равным, например, числу осмыс­ленных предложений на данном языке, рассматривае­мый путь опознавания образа каждого отдельного сооб­щения, по мнению В. А. Кожевникова и Л. А. Чистович, явно не рационален. И действительно, для того чтобы хранить в памяти образы всех возможных предложений, распознающему устройству понадобился бы совершенно невероятный объем памяти. Как показывают произве­денные Миллером, Галантером и Прибрамом расчеты, для того чтобы хотя бы один раз прослушать все грам­матически возможные английские фразы длиной до 20 слов, человеку пришлось бы слушать примерно по 3 • 1020 фраз в секунду в течение 100 лет без перерывов!
Что касается обучения машин распознаванию целых слов, то сторонники фонемного метода рассуждают так. Каждый человек, говорящий по-русски, использует для передачи сообщений около 40 основных звуков-фонем и примерно 10 000 слов. Так что же легче — на­учить машину различать 40 фонем или десятки тысяч слов? «Как показывает опьГг, — говорят специалисты,— идентифицировать фонемы трудно, но все же это един­ственно разумное решение».
Как мы видим, среди ученых нет единого мнения от­носительно выбора оптимального метода автоматиче­ского распознавания речи. И в этом нет ничего удиви­тельного. Ведь до сих пор нам неизвестны инвариант­ные признаки фонем, по которым происходит их опо­знавание. Более того, неизвестно точно, опознаются ли элементы речи по фонемам, образы которых накоплены в памяти человека, или в памяти заложены образцы слов с их окончаниями и приставками и по этим образцам опознаются слова.
«Наивысшим и совершеннейшим человеческим при­способлением» назвал звуковую речь человека выдаю­щийся русский физиолог И. П. Павлов. Физическая природа звуковой речи хранит в себе множество тайн. Как образуются звуки в голосовом аппарате человека, как они воспринимаются слухом и от чего зависит ха­рактер звука — вот проблема, в центре которой еще по сей день скрещиваются интересы ученых, работающих в самых разнообразных областях науки. Для того чтобы машины могли безошибочно выделять какой-то один об­раз из множества других сходных, нужно точное знание характерных его признаков. Но как выбрать такие при­знаки? Над решением этой задачи во всем мире ныне работают физиологи и лингвисты, акустики и невропа­тологи, специалисты по бионике и логопеды, психологи и инженеры, математики и конструкторы. Объединенные усилия всех этих специалистов, надо полагать, в конце концов раскроют тайны устной речи, дадут нам досто­верные сведения о механизмах речи, о том, как мы го­ворим и слышим, почему понимаем слова.
А пока? А пока каждый ученый, работающий над созданием устройств по автоматическому распознава­нию речи, идет избранным им путем.
Для проверки того или другого принципа автомати­ческого распознавания речи ученые обычно строят фо-нетограф. Его блок-схема выглядит так: микрофон — усилитель — распознающее устройство — электриче­ская пишущая машинка. Появление фонетографов на­вело ученых на такую мысль: а что, если использовать это устройство в качестве самой обыкновенной пишу­щей машинки? Диктовать в микрофон текст доклада или научной статьи и получать на выходе тот же текст от­печатанным? Так сказать, автоматизировать труд маши­нисток или стенографисток, а может быть, и работу ти­пографских наборщиков. Такой аппарат мог бы оказать неоценимую услугу также сотрудникам вычислительных

центров. Они смогли бы вводить данные в вычислитель­ную машину, просто диктуя их в микрофон.
Небезынтересно отметить, что возможность создания автоматического стенографа — пищущей машинки была доказана еще в начале сороковых годов советским уче­ным профессором Л. Л. Мясниковым, построившим ди­намический анализатор — прибор для объективного распознавания звуков речи. Однако реализация этой идеи была отложена из-за начавшейся Великой Отече­ственной войны.
Над созданием пишущих машинок-автоматов, печа­тающих под диктовку, ныне работают ученые ряда стран. Можно проектировать машинки, печатающие с голоса, для печатания слов, слогов, букв или звуков (фонем). По сложности конструкции и трудоемкости изготовления эти устройства очень разнятся. Так, для словесных машинок требуется очень большая память и само печатное устройство получается сложным и гро­моздким. Зато чисто фонетическая машинка должна содержать в памяти около 40 знаков и иметь столько же печатных знаков. Но такие устройства обладают чрез­вычайно существенным недостатком: для чтения напе­чатанного материала требуется определенный навык, так как фонетографы дают на выходе фонетическую запись, т. е. значки, соответствующие звукам речи, а не буквам продиктованного текста, — своего рода тран­скрипцию. Почему же они непохожи друг на друга?
Дело в том, что произносимые звуки не соответст­вуют буквам русского алфавита. Сорока фонемам рус­ской речи соответствуют 33 буквы алфавита. Помимо того, что в нашем алфавите есть непроизносимые буквы (ь, ъ), но и пишем-то мы часто совсем не то, что слышим. Произнесите, например, слово «лоб». На конце отчет­ливо слышится «п». Но если вы напишите так, как слы­шите, вас сочтут неграмотным.
Займись наши ученые проблемой распознавания речи не 15 — 20 лет назад, а во времена Кирилла и Мефодия — положение было бы сойеем другим. И вот почем}'. 13 веков назад Кирилл и Мефодий создали русскую письменность, в которой каждому звуку соответствова­ла буква. Но за прошедшие 1300 лет в нашем произ­ношении произошли большие изменения, а эволюция фонетической системы языка не получила достаточного отражения в письменной речи. Вот й получается опи­санная выше ситуация.
Как же заставить фонетическую машинку выполнять работу по перекодированию звуков в буквы подобно тому, как это делает пишущая под диктовку машинист­ка? Да и возможно ли это вообще? Возможно. Перевод звуков речи в буквы должен происходить в соответствии с грамматическими, орфографическими и лексическими правилами. Для этого машинка должна быть наделена «памятью» на определенное количество звуков, сочета­ний или слогов. Отсюда, конечно, не следует, что в памяти машинки должны быть заложены все звукосоче­тания, вполне достаточно иметь наиболее ходовые и типичные звукосочетания, при произнесении которых возможен неточный перевод звуков в буквы. Очень ред­ких сочетаний или сочетаний, легко распознаваемых ма­шинкой, может в памяти и не быть, так как это не вы­зовет трудностей в чтении материала и легко может быть исправлено в процессе чтения.
Примером удачного решения задачи является фоне­тическая пишущая машинка, созданная американскими учеными Г. Олсоном и Г. Беларом. Общий вид ее кон­структивного оформления показан на рис. 6.
Блок-схему всего устройства можно рассматривать как сложный аналог слухового аппарата, части мозга, нервной системы и нервно-мышечного аппарата челове­ка, печатающего под диктовку. Бионическая схема чело­века, печатающего под диктовку, и блок-схема фонети­ческой пишущей машинки показаны на рис. 7. Чтобы понять принцип работы устройства, проследим, каким образом перерабатывается звуковая информация по пути ее следования.
Звуковая энергия улавливается наружным ухом че­ловека, передается по слуховому проходу и воздейст­вует на барабанную перепонку среднего уха. Механи­ческое движение последней передается жидкости, за­полняющей улитку (внутреннее ухо), при помощи слу­ховых косточек, которые, подобно рычажкам, перемеща­ются нелинейно. При этом происходит «компрессия» («сжатие») сигнала, т. е. большие амплитуды уменьша­ются сильнее, чем малые, причем уменьшение амплитуды пропорционально ее величине.



На рис. 7 показано схематическое изображение «раз­вернутой» улитки и показаны частоты, воспринимаемые различными ее участками. Здесь осуществляется пер­вичный анализ информации. Дальнейший ее анализ про­исходит в мозге, куда сигналы поступают по слуховому нерву. На основе этого анализа мозг вырабатывает команды, посылаемые мышцам руки, нажимающей на соответствующие клавиши пишущей машинки.
В машине, распознающей речь, голос оператора вос­принимается микрофоном и преобразуется в электри­ческие колебания соответствующих частот. Желатель­но, чтобы результаты распознавания не зависели от громкости произносимых слов и расстояния от микро­фона. Для этой цели в машине применен звуковой ком­прессор, представляющий собой специальный нелиней­ный усилитель, который хорошо имитирует работу сред­него уха.
После усиления и компрессии речевой сигнал посту­пает на анализатор частот — систему из восьми поло­совых фильтров, охватывающих диапазон 250—10 000 гц, и систему детекторов сравнения амплитуд. Последняя собрана так, что реле, соответствующее данному каналу, включается лишь тогда, когда уровень в нем больше среднего уровня в двух соседних каналах. Выходной сигнал частотного анализатора поступает в виде двоич­ного восьмиразрядного кода в корректированную по времени «спектральную память». В ней запоминаются состояния восьмиканальных реле в течение пяти после­довательных интервалов времени. Образующаяся матри­ца 5X8, соответствующая произнесенному слогу или слову, считывается устройством распознавания комби­нации сигналов лишь тогда, когда вся матрица будет полностью образована.
Речь опознается по группе фонем, составляющих слог, а не по отдельным фонемам (причина этого за­ключается в том, что распознавание многих фонем вне контекста очень трудно). В слоговой памяти хранятся комбинации сигналов, соответствующие различным произношениям одного и того же слога или слова. Осу­ществляемое устройством распознавание 40-битной матрицы, соответствующей произнесенному слогу, пред­ставляет собой определенный вид процесса сравнения



с имеющимися в слоговой памяти «эталонными» матри­цами звукосочетаний.
Распознавание слога, если оно произведено, вызы­вает срабатывание того реле из памяти написания, ко­торое связано с написанием данного слога. В памяти написания (орфографической памяти) имеются типовые комбинации сочетаний букв, представляющих 40 фонем, для заданных 100 слогов. Реле соединено с шинами очередности следования букв и с шинами кода букв в блоке управления печатанием, который в свою оче­редь управляет работой буквенных приводов. Наконец происходит печатание выбранных букв.
Таким образом, слово печатается в соответствии с заранее определенным написанием, которое по необхо­димости должно быть одинаковым для одинаково зву­чащих слов. Именно поэтому устройство и было названо «фонетической пишущей машинкой».
По данным Г. Олсона и Г. Белара, для того чтобы в английской речи понять 98% произносимых слов и фраз, достаточно иметь «память» приблизительно на 2000 слогов. При этом орфография оказывается пра­вильной примерно в 85%) случаев. По расчетам М. А. Са-пожкова, для русской речи нет необходимости в таком объеме памяти, так как фонетическая и печатная формы русских слов различаются в значительно меньшей сте­пени, чем английских (требуется память менее чем на 300 звукосочетаний гщла. СГ и ГС и около 100 звукосо­четаний со сложными консонансами).
Несколько моделей машинок, пишущих с голоса, сконструировал научный сотрудник Женевского уни­верситета Дрейфус-Граф. Текст читают в микрофон. Звуки, из которых состоят слова, анализируются элек­тронным «мозгом», и каждый звук превращается в эле­ктрический сигнал. Эти сигналы приводят в действие рычаги электрической пишущей машинки. Как утвер­ждает изобретатель, последнюю модель его пишущей машинки можно «научить» писать со скоростью стено­графистки высшей квалификации.
Над созданием пишущих машинок, печатающих под диктовку, работают и советские ученые ряда научно-ис­следовательских организаций. Достигнутые в последние годы успехи в этой области позволяют надеяться, что в ближайшее время появятся сначала промышленные образцы фонетических машинок, затем будет органи­зован серийный выпуск пишущих машинок-автоматов, обеспечивающих правильную орфографию. А отсюда уже один шаг до устройств, которые станут составной частью переводческих машин. Когда же наши машины в достаточной степени обогатят свой словарный запас — а это время, надо полагать, недалеко, — они смогут про­изводить синхронный перевод на несколько иностран­ных языков.
Впрочем, автомату-переводчику придется различать не только чужую речь, но и говорить самому.
Однажды Норберт Винер сказал: ˜"
«Вполне возможно, чтобы человек разговаривал с ма­шиной, машина — с человеком и машина — с машиной».
С тех пор прошло около 20 лет. Первая часть пред­видения ученого близка к осуществлению. А что дела­ется или что уже сделано ныне для реализации второй части предсказания отца кибернетики о возможности разговора между машиной и человеком?
«Я спросил:
Были вы рады дождю, который прошел сегодня после полудня? Он ответил:
Нет, я люблю больше солнечную погоду.
В жаркую погоду человеку нужна по крайней мере одна ванна в день, — заметил я.
Да, я как раз был на улице и изнемогал от жары, — последовал ответ.
Когда придет рождество, будет холодная пого­да,— глубокомысленно заметил я, пытаясь поддержать разговор.
Холодная погода? — переспросил мой собесед­ник.— Да, обычно в декабре морозно.
Сегодня ясная погода, — гнул я свою линию.— Как вы думаете, долго ли она будет продолжаться?
Позвольте мне не лгать, — взмолился мой собе­седник, сбитый с толку столь противоречивыми выска­зываниями. Как же дождливая погода может быть яс­ной?»
Говорят, этот разговор состоялся в Университете в Торонто между канадским ученым Берклеем и элект­ронной вычислительной машиной. В ее «память» ввели триста английских слов и научили поддерживать не­сложную беседу.
За достоверность приведенного диалога мы не руча­емся. Но если бы вы, читатель, лет пять назад загляну­ли в одну из комнат Института электроники, автомати­ки и телемеханики Академии наук Грузинской ССР, то вы бы увидели оригинальную экспериментальную машину, которую ученые назвали «синтезатором чело­веческой речи». Машина сама формировала отдельные звуки речи — фонемы — и, строго придерживаясь зако­нов фонетики, составляла из них отдельные слова и даже целые фразы. И несмотря на младенческий воз­раст, она научилась говорить разными голосами — муж-l.chm, женским, детским. Она одинаково легко и внятно произносила одно слово «мама» и целую фразу на гру­зинском языке, которая в переводе означала: «Будь внимательна, дорогая Нона!» Этими словами машина напутствовала молодую грузинскую шахматистку Нону Гаприндашвили, когда та собиралась на международный турнир. Экспериментаторы научили машину четко про­износить также несколько фраз на русском языке, на­пример: «Наша машина училась, она узнала жизнь». Хоть все эти фразы были заложены в память машины в виде шутки, но за достоверность того, что она их внятно и четко произносила, мы ручаемся.^
Аналогичные устройства, но со значительно большим словарным запасом разрабатываются сейчас в США и ряде других стран с использованием методов синтеза речи из слоговых и из фонемных сегментов. Оба мето­да пока конкурируют друг с другом. Для передачи фо­немных сегментов служит созданное для применения в технике дальней связи устройство «Вокодер», в котором место микрофона занимает «пишущая машинка» для по­дачи электрических импульсов. Специально обученная машинистка нажимает на клавиши, соответствующие определенным фонетическим знакам. Скорость «печа­тания» должна быть равна скорости речи. Получается своеобразный «разговор руками». Для передачи слого­вых сегментов применяют специальную перфорирован­ную ленту с кодированными номерами сегментов. Эта лента подготавливается на буквопечатающем аппарате со слоговым анализатором, группирующим буквы в сло­ги и выдающим соответствующий номер сегмента. На приемном конце по сигналам, приходящим из памяти, выдаются в усилитель соответствующие сегменты, и
Синхронизатор объединяет их в слова. Качество речи пока получается недостаточно высоким из-за стыковых явлений.
Применяются также синтезаторы речи, построенные на принципе синтеза речи по формантам и использую­щие электрический эквивалент речевого аппарата. Для их построения требуется устройство для перевода пе­чатного текста в кодовые комбинации для управления эквивалентом речевого аппарата. Если повторяющиеся
y.y, -----



*.«» • *¦




6/ и

Рис. 8. Видиограмма записи гласных у, о, а, э, ы и (по А. Мит-ронович-М оджеевской). Видны отдельные верхние тона.

импульсы генератора подать на цепочку контуров, каж­дый из которых может настраиваться на соответствую­щую частоту, то удается создать довольно разборчивую искусственную речь.
Весьма распространенным является анализ звуков по данным динамических спектров видимой речи.
Принцип метода состоит в следующем. Изменение спектральных характеристик речевого потока исследу­ется при помощи динамических спектрографов «види­мой речи». Анализатор «видимой речи» изображает речь в виде динамической картины изменения интенсивности во времени в частотных полосах — как распределение оптической плотности на фотографической пленке. Формантные области выделяются как области интенсив­ного почернения. Электроакустический анализ гласных при помощи динамического спектрографа «видимой речи» показан на рис. 8.
Если применить фотоэлемент, преобразующий изме­нения светового потока в изменения электрического тока, то можно получить электроакустическую картину изменения спектра во времени.
На рис. 9 показана схема звукового спектрографа К. Поттера (1945 г.). Голос, поступивший в микрофон,

Am чимрушщие фильтры


1'ис. 9. Схема звукового спектрографа.


пропускается через набор полосовых фильтров, и выход­ные напряжения каждой полосы используются для уп­равления яркостью маленьких лампочек, излучение ко­торых оставляет следы на движущейся светочувстви­тельной ленте. В полученной записи по оси орДинат — частота* по оси абсцисс — время, а интенсивность зву­ка выражена плотностью почернения светочувствитель­ной эмульсии.
Процесс обучения машины нередко сравнивают с обучением ребенка. Но ребенок, как известно, первым делом начинает понимать слова, потом учится говорить и лишь много позже — читать. С машинами пока что все происходит наоборот. «Работоспособные» читаю­щие автоматы уже созданы, азтоматы, умеющие слу­шать и распознавать человеческую речь, находятся е зените эксперимента, а вот говорящие машины пребы­вают еще в зачаточном состоянии. Сегодня диалог че­ловека с машиной еще невозможен.
А для чего, собственно, нужен такой разговор?
Как уже говорилось выше, операторы и диспетчеры имеют ныне дело с большим количеством разнообраз­ных сигналов, подаваемых на пульт управления. Одно­временное наблюдение за многими приборами становит­ся подчас затруднительным. Снижается быстрота реак­ции на сигналы, совокупность которых (ее принято называть, как вы знаете, информацией от машины к че­ловеку) представляет собой определенный код, который приходится расшифровывать. А куда проще узнать пря­мо от говорящего пульта, например, о режиме работы какого-нибудь агрегата, машины, системы или о при­чинах и точном месте аварии, чем определять все это по оптическим и акустическим сигналам. Кроме того, «говорящие автоматы» могут войти составной частью в вычислительные машины, выступающие на производ­стве в роли советчика мастера или оператора. Оператор обратится с вопросом к такой машине, а та быстро вы­числит необходимые данные и тут же голосом даст от­вет либо отпечатает его на машинке. А оператор, в зависимости от обстановки, примет решение, как лучше, оптимальнее вести процесс.
Мы уже привыкли к тому, что, набрав по московско­му телефону номер 100, слышим монотонный голос: «Десять часов две минуты». Это простейший говорящий автомат точного времени — автоответчик со сменными записями на магнитной ленте. Но скоро на помощь человеку придут справочные быстродействующие элек­тронные машины — звуковые энциклопедии. По устно­му запросу человека (например, по телефону) машина мгновенно отыщет нужную информацию и ответит на вопрос из области науки, культуры, быта...
В дальнейшем, по-видимому, говорящие машины най­дут широкое применение и в связи. Если из речи авто­матически выделять на входе характерные признаки фонем и передавать только эти признаки, а на выходе по ним восстанавливать речь, то ширину канала связи можно сократить в несколько сот раз. Значит, по одной и той же линии сможет вести переговоры значительно большее число людей.

Пройдут годы, и к таинственным планетам солнеч­ной системы устремятся пилотируемые космические ко­рабли. Немало опасностей будет поджидать космонав­тов, которые первыми увидят новые, неизвестные миры, и, вполне возможно, что разведчиками, предупреждаю­щими людей о грозящих опасностях, будут говорящие роботы, роботы-друзья... «Здесь температура — 105 ... Сюда можете ступать смело... Здесь зыбкая поверхность, обойдите...» — нечто подобное смогут услышать космо­навты от передвигающихся впереди роботов и своевре­менно предпринять те или иные действия. Это пока еще фантастика. Но не так уж далеко то время, когда уме­ющие слушать и говорить машины будут помогать нам быстро и на большом расстоянии голосом управлять движением поездов и самолетов, подводных и надвод­ных кораблей, тракторов и комбайнов, будут подавать команды автоматическим станкам, цехам-автоматам с единого диспетчерского пункта завода. Все это — завт­рашний день нашей науки и техники.
Проблема распознавания и воспроизведения образов речи — одна из насущных проблем бионики и киберне­тики. Сегодня мы находимся еще только в начале пути, и поэтому, разумеется, трудно сейчас предсказать, как будет организована система речи у будущих наших электронных собеседников. Но очевидно одно: если мы хотим, чтобы машина действительно понимала речь и говорила сама, ее нужно снабдить чем-то вроде второй сигнальной системы. Иными словами, необходимо соз­дать нечто похожее на вторую сигнальную систему че­ловека. Нет слов, эта работа предельно сложна и труд­но осуществима. Однако следует признать: чем сложнее становится наше представление о грядущих электрон­ных собеседниках и р нас самих, тем ближе и реаль­нее делаются эти будущие друзья-машины, умеющие нас слушать, понимать и говорить.
Мы привыкли к обыденности слов и подчас забыва­ем о величии оружия, которым владеем. Но, подумав об этом, нельзя не восхищаться щедростью людей, стре­мящихся передать свои способности, свой интеллект машинам.
Беседа двенадцатая

Зрячие машины



Существует такой проверенный опытом поко­лений тезис: «В жизни случается всякое». Как гово­рят,— бывает.
Например, недавно над одним из аэродромов ФРГ столкнулись в воздухе сразу четыре (!) самолета. Когда оценили вероятность такого события, получилась ни­чтожно малая величина. И все-таки катастрофа прои­зошла.
Это случилось потому, что воздух над современными большими аэродромами буквально «кишит» самолета­ми. С земли этого не видно, а диспетчерская служба наблюдает на экранах обзорных радиолокаторов за десятком самолетов сразу.
Радиолокатор показывает только положение само­лета в каждый данный момент, а решить, каким оно будет через полминуты,—обязанность оператора. Ско­рости же современных воздушных лайнеров таковы, что, если два самолета выскочат навстречу друг другу из облаков на расстоянии 1,5 км, они столкнутся преж­де, чем летчики успеют что-либо предпринять. Таким образом, безопасность пассажиров и экипажей самоле­тов в зоне аэропорта зависит от того, насколько четко работает его диспетчерская служба.
Воздушные пути сообщения год от года становятся все оживленнее. И соответственно возрастают требо­вания к четкости работы регулировщиков «воздушного движения» — диспетчеров в аэропортах. Но, к сожале­нию, даже самый аккуратный диспетчер может оши­биться. А это значит, что могут столкнуться самолеты. И сталкивались не раз и не два и не только над аэ­родромами ФРГ. Расследован.ие причин аварий посте­пенно приводило к выводу: диспетчер имел Дело со слишком большим количеством разнообразных сведе­ний. В результате он реагировал на второстепенный сигнал, а по самому важному сигналу мер не принимал. Делалось это отнюдь не умышленно и даже не по нео­пытности, а потому, что способность человека выбирать главное в потоке информации тоже имеет предел.
Надо было искать возможность «обострить внима­ние». И такая возможность бионикой был.а найдена.
С некоторых пор на аэродроме города Дайтона за обстановкой в воздухе, которая воспроизводится аэро­дромным локатором, следят не диспетчеры, а электрон­ное устройство, обязанность которого — предупреждать возникновение опасных ситуаций. Множество взлетаю­щих и садящихся самолетов находится постоянно в поле его зрения, но если они идут установленными курсами, устройство их не замечает. Однако если, скажем, два самолета движутся так, что возникает опасность столк­новения, прибор немедленно поднимает тревогу. Это устройство работает несравненно лучше, чем самый внимательный диспетчер, так как зрительный аппарат человека охватывает всю картину сразу и из-за мно­гочисленности отдельных, зачастую второстепенных ее деталей может пропустить то, на что он должен обра­тить особое внимание.
Это устройство, называемое «жабий глаз», представ­ляет собой техническое воплощение идеи, которая была реализована природой, создавшей зрительный аппарат лягушки.
Жизнь лягушки чрезвычайно сильно зависит от ра­боты ее зрительного аппарата. Глаза помогают ей охо­титься. Основная информация, которую перерабатывает мозг лягушки во время охоты, поступает от глаз. Гла­за помогают ей спасаться от врагов (при этом лягушка поступает просто: увидев врага, она прыгает туда, где темнее, ведь «в силу земноводности» для нее не важно, вода там или суша).
Огромные выпуклые глаза лягушки не могут двигать­ся, как наши, — не могут следить за добычей, наблю­дать за подозрительными событиями или отыскивать нужные предметы. Лягушка, по-видимому, не различает неподвижных предметов или по крайней мере не про­являет к ним никакого интереса, и она умрет от голода среди изобилия насекомых, если они не будут двигать­ся. И в то же время ее легко поймать на кусочек крас­ной фланели качающейся на крючке. Она выбирает до­бычу только по размерам, характеру движения и рассто­янию до нее. Лягушка прыгает, чтобы схватить предмет, имеющий форму насекомого или червя, только если этот предмет движется, как насекомое или червь. Зритель­ный аппарат лягушки посылает в мозг хозяйки лишь

Рис. 1. Схема обработки информации в глазу лягушки. Глаз лягушки «выделяет» качественные признаки вос­принимаемых им объектов — контуры, их кривизну и т. п. Электронная модель глаза лягушки — одна из первых созданных руками человека истинно биони-
ческих систем.

такие сигналы, которые для нее жизненно важны. Ска­жем, пролетает мимо муха на близком расстоянии — ля­гушка мгновенно реагирует, а летит муха на таком уда­лении, что охотиться за ней бесполезно, — животное словно бы и не видит ее. Если глаза лягушки зарегист­рируют резкое движение тени, они тотчас извещают об этом свою хозяйку, и она тут же насторожится — уж не хочет ли кто-то ее поймать и съесть? Если же тень ползет медленно, двигаясь вместе с солнцем, то зрительный аппарат лягушки ей об этом не сообщает. Словом, глаз лягушки — превосходная биологическая информационная система, перерабатывающая всю по­ступающую информацию и выбирающая из нее только ту часть, которая представляет для лягушки интерес.
Зрительный анализатор лягушки устроен очень сло­жно. В глазу лягушки имеется миллион клеток-рецепто­ров, воспринимающих световое раздражение.
В глазу лягушки происходят четыре отдельных про­цесса переработки изображения. Результаты каждого процесса передаются по особым группам волокон, рав­номерно представленных в сетчатке. Процессы обработ­ки изображения на сетчатке таковы (рис. 1):
обнаружение длительно сохраняющего положение контура;
обнаружение кривизны контура;
обнаружение движущегося контура по изменению его контрастности;
обнаружение изменения освещенности.
Работа глаза лягушки почти не зависит от общей освещенности. Поэтому способность лягушки узнавать свою жертву и моментально обращать на нее внимание не изменяется при изменении внешней обстановки. Так же, как мы можем опознавать образы в очень разнооб­разных условиях, лягушка способна видеть сбою жерт­ву и хватать ее при ярком свете и в сумерках, незави­симо от того, находится ли она в естественных услови­ях или в террариуме.
Изображение на сетчатке глаза передается в мозг лягушки по зрительному нерву не как единое целое: в мозг поступают уже кодированные, разделенные по четырем признакам элементы изображения. На рис. 1 показаны четыре предмета, находящиеся в поле зрения лягушки. Верхние предметы движутся к центру, ниж­ний правый — от центра, нижний левый — неподвижен. Когда изображение проектируется на сетчатку, то сна­чала все контуры выделяются резко (I), затем непод­вижный предмет становится невидимым (II), а контуры движущихся тел обозначаются четче и ярче (III и IV).
Каждая группа волокон зрительного нерва служит для передачи одного вида сообщений в соответствую­щий слой нервных окончаний в мозге. В мозге лягушки имеется четыре таких слоя, соответствующих четырем процессам трансформации изображения. Действия ля­гушки являются результатом переработки ее мозгом ко­дированной информации, поступающей от зрительного аппарата.
Техническая система, моделирующая работу зритель­ного анализатора лягушки, намного больше, чем его прототип, созданный природой. Это ящик объемом в 1,8 м3, в котором находится более 30 ООО реле, транзи­сторов, фотосопротивлений, неоновых ламп и других электронных компонент (рис. 2).
Главная часть прибора состоит из одинаковых вы­числительных машин, которые расположены одна за


Рис. 2. Внешний вид электронной модели глаза лягушки.

другой и воспроизводят функции четырех слоев нерв­ных окончаний в мозге, анализирующих сигналы изоб­ражения. Изображение проектируется на экран с 1296 фотоэлементами, выполняющими роль рецепторов сет­чатки. Дальше информация передается от слоя к слою и сортируется при этом на нужную и ненужную. Нуж­ная информация переносится от одного слоя к другому световыми лучами неоновых ламп и воспринимается фо­тосопротивлениями.
Устройство непрерывно анализирует обстановку над аэродромом с точки зрения ее безопасности и в случае создания угрожающего положения, при котором одному из самолетов необходимо дать команду уйти в сторону, решает, кому именно нужно дать такую команду. Лет­чики и аэродромные диспетчеры считают, что новая си­стема существенно увеличивает безопасность полетов. М. Хершел и Т. Келли, авторы первого варианта функ­циональной электронной модели глаза лягушки, счи­тают, что устройства такого типа можно с успехом ис­пользовать в радиолокационных системах противоракет­ной обороны (ПРО). В системах ПРО они могут при­меняться для мгновенного опознавания ракет, что обес­печит уменьшение времени, необходимого в наши дни для вычисления баллистических траекторий.
Интересно, что глаза голубя, которые, как известно, прекрасно воспринимают изображение, обладают той же способностью, что и глаза лягушки: они тоже осу­ществляют предварительную обработку получаемой ин­формации. Благодаря этому мозг воспринимает уже преобразованное изображение того, что видит глаз. Знание механизмов переработки информации в зри­тельном анализаторе голубя может оказаться полезным для разработки радиолокационных устройств, в частно­сти сложных устройств для разведки и съемки мест­ности.
Особый интерес представляет способность зритель­ного анализатора голубя избирать объекты, движущиеся в одном направлении. Это свойство получило название «способности обнаруживать направленное движение». Использовав его, 'можно построить обзорную радиоло­кационную систему, обнаруживающую самолеты, летя­щие в заданном направлении, например в сторону авиа­базы, и, следовательно, осуществляющую предваритель­ную обработку информации, близкую по принципу действия к функции биологической системы. Выясне­нием этого принципа заняты сейчас сотрудники одной из американских фирм, создающие модель глаза го­лубя.
Сетчатка его глаза по существу представляет собой трехслойное устройство (рис. 3, а). Внешний слой со­держит колбочки, или фоторецепторы, которые преоб­разуют воспринимаемые глазом световые сигналы в электрохимические потенциалы и передают последние в промежуточный слой, состоящий из нейронов, или нерв­ных клеток, называемых биполярными или просто би-полярами. Биполяры «переводят» сигналы, поступающие

из внешнего слоя, и передают их (как принято думать) в виде последовательностей импульсов в третий слой, состоящий из нервных окончаний, выходные импуль­сы которых направляются в мозг по волокнам зритель­ного нерва.



<< Предыдущая

стр. 9
(из 12 стр.)

ОГЛАВЛЕНИЕ

Следующая >>