Ïðîãðàììû-ñîáåñåäíèêè è èõ ïðèìåíåíèå â áèçíåñå è îáðàçîâàíèè
Æèëÿåâ Âëàäèñëàâ Îëåãîâè÷
ÏÐÎÃÐÀÌÌÛ-ÑÎÁÅÑÅÄÍÈÊÈ È ÈÕ ÏÐÈ...
34 downloads
138 Views
451KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Ïðîãðàììû-ñîáåñåäíèêè è èõ ïðèìåíåíèå â áèçíåñå è îáðàçîâàíèè
Æèëÿåâ Âëàäèñëàâ Îëåãîâè÷
ÏÐÎÃÐÀÌÌÛ-ÑÎÁÅÑÅÄÍÈÊÈ È ÈÕ ÏÐÈÌÅÍÅÍÈÅ Â ÁÈÇÍÅÑÅ È ÎÁÐÀÇÎÂÀÍÈÈ 1. ÂÂÅÄÅÍÈÅ
Åùå íà çàðå êîìïüþòåðíîé ýïîõè ëþäè õîòåëè íàó÷èòü ìàøèíû îáùàòüñÿ ñ îïåðàòîðîì íà åñòåñòâåííîì ÿçûêå. Ðàííèå ñèñòåìû, òàêèå êàê SHRDLU [1], ðàáîòàÿ ñ îãðàíè÷åííûì «ìèðîì êóáèêîâ» è èñïîëüçóÿ îãðàíè÷åííûé ñëîâàðíûé çàïàñ, âûãëÿäåëè ÷ðåçâû÷àéíî õîðîøî, âäîõíîâëÿÿ ýòèì ñâîèõ ñîçäàòåëåé. Îäíàêî îïòèìèçì áûñòðî èññÿê, êîãäà ýòè ñèñòåìû ñòîëêíóëèñü ñî ñëîæíîñòüþ è íåîäíîçíà÷íîñòüþ ðåàëüíîãî ìèðà. Äàííàÿ çàäà÷à ïîðîäèëà íàóêó êîìïüþòåðíóþ ëèíãâèñòèêó, âêëþ÷àþùóþ â ñåáÿ òàêèå ðàçäåëû, êàê ðàñïîçíàâàíèå ðå÷è, ñèíòåç ðå÷è, àíàëèç òåêñòà è ò. ä.  äàííîé ñòàòüå ìû ðàññìîòðèì ïðîãðàììû-ñîáåñåäíèêè (àíãë. Chatterbot èëè Chatbot), êîòîðûå ñîçäàíû äëÿ èìèòàöèè ðå÷åâîãî ïîâåäåíèÿ ÷åëîâåêà.
ïðîñòûì è óíèâåðñàëüíûì, ïåðåïèñêà ñâîäèòñÿ ê îáìåíó òåêñòîâûìè ñîîáùåíèÿìè. Ïîêà ÷òî íè îäíà ïðîãðàììà è áëèçêî íå ïîäîøëà ê ïðîõîæäåíèþ òåñòà. Ýòî îáúÿñíÿåòñÿ òåì, ÷òî òàêàÿ çàäà÷à ñ÷èòàåòñÿ AI-ïîëíîé, òî åñòü ïî ñëîæíîñòè ýêâèâàëåíòíîé ãëàâíîé ïðîáëåìå èñêóññòâåííîãî èíòåëëåêòà ñäåëàòü êîìïüþòåðû òàêèìè æå óìíûìè, êàê ëþäè. Åæåãîäíî ïðîèçâîäèòñÿ ñîðåâíîâàíèå ìåæäó ðàçãîâàðèâàþùèìè ïðîãðàììàìè è íàèáîëåå ÷åëîâåêîïîäîáíîé, ïî ìíåíèþ ñóäåé, ïðèñóæäàåòñÿ ïðèç ˸áíåðà. [3] Ñàìûé ëó÷øèé ðåçóëüòàò â äàííîì ñîðåâíîâàíèè ïîêàçàëà ïðîãðàììà A.L.I.C.E., âûèãðàâ òåñò 3 ðàçà (â 2000, 2001 è 2004). Íî äàæå äàííàÿ ïðîãðàììà ëèøü èìèòèðóåò îñìûñëåííûé äèàëîã, à ïî ôàêòó ïðåäñòàâëÿåò ñîáîé îãðîìíóþ áàçó âîïðîñîâ è îòâåòîâ.
2. ÇÀÄÀ×À ÑÎÇÄÀÍÈß ÏÐÎÃÐÀÌÌÛ-ÑÎÁÅÑÅÄÍÈÊÀ
 1950 ã. Àëàí Òüþðèíã ïðåäëîæèë [2] ëþáîïûòíûé òåñò äëÿ ïðîâåðêè, ÿâëÿåòñÿ ëè êîìïüþòåð ðàçóìíûì: ñóäüÿ ïåðåïèñûâàåòñÿ íà åñòåñòâåííîì ÿçûêå ñ äâóìÿ ñîáåñåäíèêàìè, îäèí èç êîòîðûõ ÷åëîâåê, äðóãîé ì êîìïüþòåð. Åñëè ñóäüÿ íå ìîæåò íàäåæíî îïðåäåëèòü, êòî åñòü êòî, ñ÷èòàåòñÿ, ÷òî êîìïüþòåð ïðîøåë òåñò. Ïðåäïîëàãàåòñÿ, ÷òî êàæäûé èç ñîáåñåäíèêîâ ñòðåìèòñÿ, ÷òîáû ÷åëîâåêîì ïðèçíàëè åãî. ×òîáû ñäåëàòü òåñò È Â ØÓÒÊÓ È ÂÑÅÐܨÇ
Åñëè ñóäüÿ íå ìîæåò íàäåæíî îïðåäåëèòü, êòî åñòü êòî, ñ÷èòàåòñÿ, ÷òî êîìïüþòåð ïðîøåë òåñò.
87
Æèëÿåâ Â.Î. 3. ÓÑÒÐÎÉÑÒÂÎ A.L.I.C.E.
Äàâàéòå çàãëÿíåì âíóòðü ALICE. «Ìîçã» ïðîãðàììû ïðåäñòàâëÿåò ñîáîé íàáîð ôàéëîâ â ôîðìàòå AIML (ïîäìíîæåñòâî XML, ÿçûê ðàçìåòêè äëÿ èñêóññòâåííîãî èíòåëëåêòà), ðàçáèòûõ íà 24.000 êàòåãîðèé [4]. Ñïèðàëü (ñì. ðèñ. 1) ïîêàçûâàåò óñòðîéñòâî «ìîçãà», ãäå äåðåâüÿ, îòõîäÿùèå îò êîðíÿ ýòî øàáëîíû âîïðîñîâ, íà êîòîðûå ALICE ñïîñîáíà îòâåòèòü. Ñàìûå áîëüøèå ïó÷êè îòâåòîâ âåòâÿòñÿ îò ñëîâ WHAT, WHEN, WHERE, WHO è ò. ä.  ëèñòèíãå 1 ïðåäñòàâëåíî, êàê âûãëÿäèò ÷àñòü «ìîçãà» ALICE.
Ðèñ. 1
Çäåñü òýã <pattern> îáîçíà÷àåò âîïðîñ, çàäàâàåìûé ïîëüçîâàòåëåì.  íåì ìîæíî èñïîëüçîâàòü ñèìâîëû ïîäñòàíîâêè (*, _). Òýã ïîêàçûâàåò îòâåò, êîòîðûé âûäàåò ìàøèíà. Êàê ìû âèäèì, ALICE ëèøü èìèòèðóåò äèàëîã. Íè î êàêîé ðàçóìíîé äåÿòåëüíîñòè êîìïüþòåðà â äàííîì ñëó÷àå ãîâîðèòü íå ïðèõîäèòñÿ. Íî äàæå òàêîãî óðîâíÿ ïðîãðàììû íàõîäÿò ñâîå ïðèìåíåíèå â ïðàêòè÷åñêèõ çàäà÷àõ. 4. ÏÐÎÃÐÀÌÌÛ-ÑÎÁÅÑÅÄÍÈÊÈ Â ÁÈÇÍÅÑÅ
 êàêîé îáëàñòè ìîãëè íàéòè ñâîå ïåðâîå ïðèìåíåíèå ïðîãðàììû, ñïîñîáíûå âåñòè îãðàíè÷åííûé äèàëîã ñ ÷åëîâåêîì? Êîíå÷íî æå â ïîääåðæêå ñåðâèñíîãî îáñëóæèâàíèÿ è ïîìîùè ïðè âûáîðå ïðîäóêöèè. Ñîãëàñíî èññëåäîâàíèÿì [5] â Àìåðèêå â 2004 ã. ïîêóïàòåëè ñäåëàëè ïîðÿäêà 1,5 ìèëëèàðäîâ çâîíêîâ â ñëóæáû ñåðâèñà, ïðè÷åì ñðåäíÿÿ ïðîäîëæèòåëüíîñòü çâîíêà 23 ñåêóíäû. È ïîñêîëüêó êëèåíòû èñïîëüçóþò âñå áîëåå è áîëåå ñëîæíûå ïðîäóêòû, òàêèå êàê öèôðîâûå âèäåîêàìåðû, èõ âîïðîñû òàêæå ñòàíîâÿòñÿ âñå ñëîæíåå. Ïðè ýòîì îäèí çâîíîê â ñðåäíåì ñòîèò êîìïàíèÿì 45 $. Èìåííî ïîýòîìó êîðïîðàöèè
Ëèñòèíã 1
<pattern>AFTER PRINCE CHARLES WHO IS * Prince William. <pattern>ALAN TURING * I really liked the biography of Turing by Andrew Hodges. <pattern>CAN I PLAY * TURING GAME We are already, playing,
88
© ÊÎÌÏÜÞÒÅÐÍÛÅ ÈÍÑÒÐÓÌÅÍÒÛ Â ÎÁÐÀÇÎÂÀÍÈÈ. ¹ 4, 2007 ã.
Ïðîãðàììû-ñîáåñåäíèêè è èõ ïðèìåíåíèå â áèçíåñå è îáðàçîâàíèè âñå ÷àùå îáðàùàþòñÿ ê ïîìîùè ïðîãðàììñîáåñåäíèêîâ, êîòîðûå íàìíîãî äåøåâëå ëþäåé èç ñëóæáû ïîääåðæêè îäíî îáðàùåíèå ñòîèò ïîðÿäêà 10 öåíòîâ. Ïðèìåðíî 300 êîðïîðàöèé ïîñòàâèëè ñåáå íà ñàéòû ïîäîáíûå êîìïüþòåðíûå àãåíòû ñ 2001 ïî 2005 ãîä. Íîâûì ëèöîì èçâåñòíîé êîìïàíèè Ikea ñòàëà ïðîãðàììà Àííà (ðèñ. 2) [5], ïðåäñòàâëåííàÿ êðàñî÷íî íàðèñîâàííîé óëûáàþùåéñÿ æåíùèíîé. Îíà ðàçìåùåíà íà ñàéòå è, èñïîëüçóÿ ñëîæíóþ áàçó äàííûõ è ëèíãâèñòè÷åñêèå àëãîðèòìû, îòâå÷àåò íà âîïðîñû êëèåíòîâ è ïîìîãàåò âûáðàòü òîâàð íà 18 ÿçûêàõ! Íàïðèìåð, Àííà ñïîñîáíà ïîêàçàòü êàðòó íà âîïðîñ ïðî áëèæàéøèé ìàãàçèí. Åñëè îíà íå ìîæåò ñàìîñòîÿòåëüíî îòâåòèòü íà âîïðîñ, îíà ïðåäëàãàåò ñîåäèíèòü ñ æèâûì îïåðàòîðîì. Ïîõîæèé ïîäõîä èñïîëüçîâàëà êîìïàíèÿ AT&T [6] íà ñâîåì ñàéòå ñ ïåðñîíàæåì Ýëëè. Íî îí áîëüøå ïðåäíàçíà÷åí, ÷òîáû ñîðèåíòèðîâàòü ÷åëîâåêà íà ñàéòå, ïîêàçûâàÿ åìó ññûëêè, ñîîòâåòñòâóþùèå âîïðîñàì êëèåíòà. Èíòåðåñíîå ïðèìåíåíèå íàøëà äàííàÿ òåõíîëîãèÿ â àìåðèêàíñêîé àðìèè. Êîðïîðàöèÿ «Next IT» ðàçðàáîòàëà Ñåðæàíòà Ñòàðà (ðèñ. 3), êîòîðûé îòâå÷àåò íà âîïðîñû áóäóùèõ íîâîáðàíöåâ.  îñíîâíîì ýòî þíîøè â âîçðàñòå îò 17 äî 24 ëåò, êîòîðûå áîëüøóþ ÷àñòü âðåìåíè ïðîâîäÿò â èíòåðíåòå. Âîò êàêèå ðåçóëüòàòû [7] ïîêàçàëî ïðèìåíåíèå äàííîé òåõíîëîãèè: âðåìÿ ïðåáûâàíèÿ íà ñàéòå âîçðîñëî ñ 4 ìèíóò äî 16 ìèíóò, êîëè÷åñòâî çàäàííûõ âîïðîñîâ âîçðîñëî ñ 6 äî 13, ïðè ýòîì Ñåðæàíò ñìîã îòâåòèòü íà 92% âîïðîñîâ, â ìåñÿö îí îòâå÷àåò ïðèìåðíî íà 100.000 âîïðîñîâ. Ðåçóëüòàòû, êîíå÷íî, âïå÷àòëÿþò. Åùå îäíèì ïðèìåðîì ìîæåò ñëóæèòü îòå÷åñòâåííàÿ ðàçðàáîòêà êîìïàíèè «Íàíîñåìàíòèêà» êàäðîâûé àãåíò Íàñòÿ (ðèñ. 4) [8]. Îíà ðàçðàáîòàíà ñïåöèàëüíî äëÿ êàäðîÐèñ. 4 âîãî àãåíòñòâà, ïîýòîìó îñíîâÈ Â ØÓÒÊÓ È ÂÑÅÐܨÇ
Ðèñ. 2
Ðèñ. 3
íîé óïîð áûë ñäåëàí íà óìåíèè Íàñòè ðàññêàçûâàòü îá óñëóãàõ àãåíòñòâà, îòâå÷àòü íà âîïðîñû êàíäèäàòîâ è ïîäáèðàòü âàêàíñèè èç áàçû äàííûõ òåêóùèõ âàêàíñèé êîìïàíèè. 5. ÏÐÎÃÐÀÌÌÛ-ÑÎÁÅÑÅÄÍÈÊÈ Â ÎÁÐÀÇÎÂÀÍÈÈ
Ïðî ïðèìåíåíèå ÷àò-áîòîâ â îáðàçîâàíèè ìíîãî ãîâîðèòñÿ â ïîñëåäíåå âðåìÿ. Íî ïîêà â äàííîé îáëàñòè èñïîëüçóþòñÿ ïåäàãîãè÷åñêèå àãåíòû (Pedagogical Agents), êîòîðûå òàêæå ïðåäñòàâëÿþòñÿ êàêèì-ëèáî ïåðñîíàæåì, íî ïðè ýòîì íå îáëàäàþò åñòåñòâåííî-ÿçûêîâûì ñïîñîáîì ââîäà. Ïðîãðàììû-ñîáåñåäíèêè ìîãóò âûñòóïàòü â ðîëè ñîîáó÷àþùèõñÿ, êîíêóðåíòîâ ïî îáó÷åíèþ, ïîìîùíèêîâ è èíñòðóêòîðîâ. Äëÿ ýôôåêòèâíîé ïåäàãîãèêè àãåíò äîëæåí îòâå÷àòü íà âîïðîñû, äàâàòü ïîäñêàçêè è îáúÿñíåíèÿ, îòñëåæèâàòü àêòèâíîñòü è ïðîãðåññ îáó÷àþùåãîñÿ. Ê ðàáîòàþùèì ðåøåíèÿì ìîæíî îòíåñòè ñèñòåìó SmartHelp îò êîìïàíèè Apangea [9]. Îíà â îñíîâíîì ïðèìåíÿåòñÿ äëÿ îáó÷åíèÿ ó÷åíèêîâ 511 êëàññîâ ìàòåìàòèêå, íî â öåëîì ïàêåò ìîæåò áûòü èñïîëüçîâàí è â äðóãèõ îáëàñòÿõ. Ñîãëàñíî ñëîâàì âèöåïðåçèäåíòà êîìïàíèè, ñèñòåìà âåäåò îò 80 äî 90 ïðîöåíòîâ îáó÷åíèÿ, è «æèâîé» ó÷èòåëü âûçûâàåòñÿ òîëüêî â òåõ ñëó÷àÿõ, êîãäà ñàìà ïðîãðàììà ñïðàâèòüñÿ íå ìîæåò.  íàñòîÿùèé ìîìåíò ïðîãðàììà îáó÷àåò ïîðÿäêà 300 ó÷åíèêîâ åæåäíåâíî. Èíòåðåñíî òàêæå îòìåòèòü ñèñòåìó Wizard-of-Oz [10], îáó÷àâøóþ ñòóäåíòîâ Áåðíèìãåìñêîãî óíèâåðñèòåòà ýëåêòðîíèêè îñíîâàì ïðîãðàììèðîâàíèÿ íà ÿçûêå C â
89
Æèëÿåâ Â.Î. 6. ÏÅÐÑÏÅÊÒÈÂÛ ÐÀÇÂÈÒÈß
...«æèâîé» ó÷èòåëü âûçûâàåòñÿ òîëüêî â òåõ ñëó÷àÿõ, êîãäà ñàìà ïðîãðàììà ñïðàâèòüñÿ íå ìîæåò. ïðîöåññå îáñóæäåíèé ðàçëè÷íûõ àñïåêòîâ ÿçûêà.  õîäå ýòîãî ýêñïåðèìåíòà ñòóäåíòû âûðàçèëè óäîâîëüñòâèå îò îáùåíèÿ ñ ïðîãðàììîé-ñîáåñåäíèêîì, ëåãêîñòü âçàèìîäåéñòâèÿ è æåëàíèå ïðîäîëæàòü îáó÷åíèå ñ ïîìîùüþ äàííîé ïðîãðàììû.
Íà äàííûé ìîìåíò ïðîáëåìà ðàçâèòèÿ ïðîãðàìì-ñîáåñåäíèêîâ, íà ìîé âçãëÿä, çàêëþ÷àåòñÿ â ïîïûòêå èìèòèðîâàòü äèàëîã, ðåøàÿ çàäà÷ó â îãðîìíîì êîëè÷åñòâå ÷àñòíûõ ñëó÷àåâ. Íåîáõîäèìî ðåøåíèå ïðîáëåìû â êîðíå, à èìåííî ñîçäàíèå âûñîêîòî÷íîãî ñåìàíòè÷åñêîãî àíàëèçàòîðà, êîòîðûé ìîã áû ñîïîñòàâèòü ââîäèìîìó ïîëüçîâàòåëåì òåêñòó ñìûñë â ôîðìå, ïîíÿòíîé êîìïüþòåðó. Òðåáóåòñÿ ïðèìåíèòü áîëåå ãëóáîêèå íàó÷íûå ðàçðàáîòêè êàê â îáëàñòè òåîðåòè÷åñêèõ îñíîâ èíôîðìàòèêè, òàê è â îáëàñòè ëèíãâèñòèêè.  ÷àñòíîñòè, ïðèìåíåíèå ïîäõîäà Â.À. Òóçîâà [11] ê çàäà÷å ñîçäàíèÿ ïðîãðàììû-ñîáåñåäíèêà ìîæåò êà÷åñòâåííî óëó÷øèòü îïûò ïîëüçîâàòåëÿ îò îáùåíèÿ è ðåëåâàíòíîñòü îòâåòîâ, êîòîðûå ïðîãðàììà âûäàåò. Ýòî ðàçðåøèò ìíîãèå ïðîáëåìû ñîâðåìåííûõ ïðîãðàìì-ñîáåñåäíèêîâ, òàêèå êàê íàëè÷èå ðàçëè÷íûõ ñëîâîôîðì, ñèíîíèìîâ è äàæå ôðàçåîëîãèçìîâ.
Ëèòåðàòóðà 1. Procedures as a Representation for Data in a Computer Program for Understanding Natural Language. MIT AI Technical Report 235, Ôåâðàëü 1971. 2. Alan Turing. Computing Machinery and Intelligence. Mind, vol. LIX, no. 236, October 1950, pp. 433-460. 3. Âåá-ñàéò ïðîåêòà: http://www.loebner.net/Prizef/loebner-prize.html 4. Âåá-ñàéò ïðîåêòà: http://www.alicebot.org/ 5. Âåá-ñàéò êîìïàíèè: www.ikea.com/ms/en_US/customer_service/splash.html 6. Âåá-ñàéò êîìïàíèè «AT&T»: www.allie.att.com/nlq/virtual_rep.jsp 7. Âåá-ñàéò êîìïàíèè «Next IT»: http://www.nextit.com/Army_Success.ashx 8. Âåá-ñàéò êîìïàíèè «Íàíîñåìàíòèêà»: http://www.nanosemantics.ru/project-nastya/index.shtml 9. Ïóáëèêàöèÿ íà ñàéòå ChatbotHUB: «Internet Taking On New Role In Education». 10. Kerly, A., Hall, P. & Bull, S. (2006). Bringing Chatbots into Education: Towards Natural Language Negotiation of Open Learner Models, in R. Ellis, T. Allen & A. Tuson (eds), Applications and Innovations in Intelligent Systems XIV Proceedings of AI-2006, 26th SGAI International Conference on Innovative Techniques and Applications of Artificial Intelligence, Springer. 11. Òóçîâ Â.A. Êîìïüþòåðíàÿ ñåìàíòèêà ðóññêîãî ÿçûêà. ÑÏá.: Èçä-âî Ñ.-Ïåòåðá. óí-òà, 2004.
Æèëÿåâ Âëàäèñëàâ Îëåãîâè÷, àñïèðàíò 2 êóðñà îòäåëåíèÿ èíôîðìàòèêè ìàòåìàòèêîìåõàíè÷åñêîãî ôàêóëüòåòà ÑÏáÃÓ.
90
© ÊÎÌÏÜÞÒÅÐÍÛÅ ÈÍÑÒÐÓÌÅÍÒÛ Â ÎÁÐÀÇÎÂÀÍÈÈ. ¹ 4, 2007 ã.