Pożyteczna AI w służbie SWPS

Komunikacja Człowiek-Komputer Komentarze (1) »
Wirtualna Asystentka Ania

Wirtualna Asystentka Ania

Wirtualne postacie nie są popularne na polskich stronach www. Problem z przetwarzaniem języka naturalnego przez komputery powoduje, że takie wdrożenie nie zawsze się opłaca. Są jednak pozytywne przykłady, takie jak Wirtualna Asystentka SWPS Ania. Od jakiegoś czasu obserwuje co nowego dzieje się w botyce w polskiej sieci i myślę, że można śmiało powiedzieć, iż poza implementacjami chatterbota na stronie producentów, Wirtualna Asystentka SWPS jest najbardziej udanym tego typu wdrożeniem.

Czytaj dalej »

Cyfrowy towarzysz coraz mądrzejszy

Komunikacja Człowiek-Komputer Komentarze (0) »

Dla wielu kognitywistów zrozumienie umysłu oznacza zbudowanie jego adekwatnego modelu. Choć taki sposób uprawiania nauki nie jest doskonały, ma wiele praktycznych zastosowań. To, co zdołaliśmy dowiedzieć się o poznaniu wykorzystywane jest do progRascallo - ucieleśniony chatterbotramowania cyfrowych postaci zwanych botami.

Boty tworzy się, aby usprawnić komunikację człowieka z maszyną. Wciąż największym wyzwaniem jest poprawne przetwarzanie przez komputery języka naturalnego. Jak dotąd żaden z wymyślonych botów nie przeszedł testu Turinga.


Co mi powiesz o Britney Spears?

Podglądając zainteresowania badawcze kognitywistów z Bułgarii znalazłem informacje o projekcie RASCALII. Celem jest stworzenie spersonalizowanych agentów żyjących i uczących się w Internecie.

Na razie projektanci doskonalą bota według dwóch scenariuszy:

  1. Aby zbierał informacje konieczne bezbłędnego rozwiązywania quizów
  2. Aby wyszukiwał i organizował informacje związane z muzyką

Są to jedynie demonstracje możliwości agenta. Użytkownik może komunikować się z cyfrowym towarzyszem używając języka naturalnego. Gdy nasz agent znajdzie dla nas to czego szukamy możemy ocenić efekt jego pracy. Specjaliści od Sztucznej Inteligencji nazywają to uczeniem nadzorowanym, ale użytkownik po prostu dobrze się bawi okazując satysfakcję bądź niezadowolenie przez wciśniecie odpowiedniego przycisku.

Music Explorer pozwala przedstawić agentowi swoje muzyczne zainteresowania. Ten zgromadzi komplet informacji np. o naszym ulubionym artyście oraz zbliżona stylem muzykę. W miarę upływu czasu twój muzyczny profil agent będzie uzupełniał m.in. o dane z kanałów RSS dotyczące np. wydania nowej płyty.

Inspiracje

Jest to kolejny krok naprzód Sztucznej Inteligencji, ponieważ architektura poznawcza inspirowana jest ideą poznania ucieleśnionego – umysłu, który osadzony jest w ciele i otoczeniu, a percepcja służy działaniu. Środowisko zdefiniowane jest przez użytkownika, innego bota lub bazę wiedzy. Sensoryczność polega tu na przetłumaczeniu danych z otoczenia na kod umysłu. Motoryka zaś pozwala wykonywać akcje typu: wysyłanie zapytań, komunikacja z użytkownikiem itp.

Autorzy zamodelowali dwa moduły pamięci długotrwałej – przechowującą fakty i epizodyczną. Pamięć robocza zaś to aktywny element pamięci długotrwałej. Dla Czytelników zaznajomionych z psychologią poznawczą inspiracje te są dobrze znane.

Ze szczegółami architektury można zapoznać się na stronie projektu. (Naprawdę warto!)

SEMcaptcha – wszystko co ludzkie, botom jest obce

Komunikacja Człowiek-Komputer Komentarze (0) »

Internautom CAPTCHA znana jest przede wszytkim z formularzy rejestracyjnych np. na fora internetowe lub konta e-mail. Co to jest CAPTCHA? Nazwa to akronim od Completely Automated Public Turing test to tell Computers and Humans Apart. Są to różne  zabezpieczenia na stronach www, celem których jest dopuszczenie do przesłania danych tylko wypełnionych przez człowieka.

Są to rozwiązania nierzadko trudne do rozpoznania przez zwykłych użytkowników. Jeszcze większy problem stanowi CAPTCHA oparta na rozpoznawaniu wzorca dla osób niewidomych, które posługują się programami czytającymi stronę. O problemach z używaniem CAPTCHA warto przeczytać na blogu Roberta Drozda.

Od niedawna rozwijana jest alternatywa wobec technik zabezpieczających opartych na rozpoznawaniu obrazu. Jej inspiracją są osiągnięcia kognitywistyki.

Projekt SemCAPTCHA logików doktora Mariusza Urbańskiego i Pawła Łupkowskiego z Zakładu Logiki i Kognitywistyki UAM wykorzystuje kompetencję językową użytkowników do zabezpieczenia systemu informatycznego przed botami. Prezentowane są trzy, lekko zdeformowane wyrazy, a zadaniem użytkownika jest kliknięcie w ten, który znaczeniowo nie pasuje do pozostałych. Różnica pomiędzy człowiekiem a botem rozwiązującym takie zadanie polega nie tylko na podaniu właściwej odpowiedzi, ale dodatkowo na czasie potrzebnym do rozwiązania testu. Nawet jeśli program (np. oparty na sieciach neuronowych) będzie potrafił rozsztrzygnąć, że np. z trójki gołąb – mysz – szczur nie pasuje gołąb, to zajmie mu to więcej czasu niż człowiekowi. Aby wzmocnić efekt szybkości rozwiązania zastosowano pozytywny priming semantyczny. Zjawisko to polega na tym, że jeśli nawet na kilka milisekund wyświetlone będzie jakieś słowo np. skrzydła, to reakcja na gołębia w prezentowanej trójce  gołąb – mysz – szczur będzie znaczaco szybsza. Warunkiem jest to, aby słowo poprzedzające było znaczeniowo związane z tym, które ma być rozpoznane. Przykład można znaleźć na stronie projektu.

Interfejs tylko dla Ciebie

Komunikacja Człowiek-Komputer Komentarze (0) »

Stworzenie interfejsu, który będzie współgrał z każdym modelem mentalnym jest niemożliwe. Nie jest to tylko problem projektantów serwisów wielotematycznych. Dokładne określenie grupy targetowej i szereg badań, choć optymalizuje architekturę informacji nie jest rozwiązaniem idealnym. Jeśli więc nie projektowanie jako proces, to co ?

Badacze z Uniwersytetu Waszyngtonskiego stworzyli narzędzie automatycznie generujące interfejs na podstawie matematycznego modelu użytkownika o nazwie SUPPLE. Model oparty jest o 20 minutowy test (dla osób niepełnosprawnych trwa on 90 minut). Test polega np. na jak najszybszym kliknięciu na pojawiające się na ekranie kropki o coraz większym rozmiarze.

SUPPLE korzystając z modelu użytkownika automatycznie przystosowuje się do mozliwości wzrokowych i motorycznych danej osoby. Ma to szczególne znaczenie w przypadku korzystających z komputera osób starszych lub niepełnosprawnych. Zastosowane algorytmy (o których więcej na stronie projektu) pozwala dostosować do stylu użytkownika wygląd, organizację treści i strukturę nawigacji.

Dla zainteresowanych programistów, dostepny jest SUPPLE UI Toolkit zawierający biblioteki umożliwiające budowę aplikacji (za pomocą AWT, pakietu Swing czy zwykłego HTML) z opartym na SUPPLE generatorem interfejsu.

Ludzkie oblicze komputera

Komunikacja Człowiek-Komputer Komentarze (0) »

Już Arystoteles wiedział, że człowiek jest istotą społeczną. Jednym z bodźców, które najszybciej przyciągają naszą uwagę jest ludzka twarz, a „uczłowieczanie” artefaktów także jest czymś naturalnym.

Odpowiedzią na to w świecie Internetu i komputerów mogą być chatterboty oraz inne typy interfejsów „z twarzą”. Są to aplikacje symulujące inteligentną rozmowę, najczęsciej wyposażone w tzw. awatar, czyli wizualizacja twarzy.  Zastosowanie norm ludzkiego zachowania i zasad społecznych w projektowaniu interfejsów, choć na razie rzadkie, może być szansą, by ułatwić użytkownikowi pracę czy zabawę. Na stronach AI Dreams można znaleźć spis chatterbotów. Są one w większości angielskojęzyczne.

Boty są aplikacjami wciąż niedoskonałymi i większość użytkowników już po chwili orientuje się, że nie rozmawia się z nimi jak z człowiekiem. Mimo oczekiwań Turinga, który w 1953 wyraził opinię, że do 2000 roku będzie mozna powiedzieć, że myślą, problemów wciąż jest wiele – a przede wszystkim problem z rozumieniem kontekstu czy wieloznaczności. Turing zaproponował rozstrzygnięcie problemu sprawdzenia czy maszyna myśli – test Turinga. Idea ta kontyuowana jest w postaci konkursu Loebnera. Uczestnikami zawodów sa właśnie chatterboty. Wygrywa ten, którego wypowiedzi najbardziej przypominają dialog z  człowiekiem. Jednym z najbardziej znanych laureatów tego konkursu jest A.L.I.C.E.

Możliwych zastosowań „gadających głów” jest wiele:

  • może odpowiadać na pytania klientów na stronie internetowej firmy
  • przedstawiać ofertę przedsiębiorstwa
  • przeprowadzać ankiety

Informacje te podaje za stroną firmy SztucznaInteligencja.pl, która zajmuje się programowaniem botów dla stron biznesowych. Mozna tam także porozmawiać z botem Jakubem, jednym z nielicznych botów mówiących po polsku.

Les Wilson, odpowiadający za projekty multimodalne (nie multimedialne!) w IBM, w 1995 sformułował wobec aplikacji agenckich (a są nimi także chatterboty) następujące wymagania wobec inteligentnego software agent:

  • okazuje przekonania, pragnienia i cele
  • jest ekspertem w jakiejś dziedzinie (np. potrafi kompetentnie odpowiadać na pytania dot,. oferty firmy – przyp. M.G.)
  • potrafi nabywać wiedzę z kontekstu
  • dostosowuje się do poziomu umiejętności użytkownika
  • współpracuje i wchodzi w interakcje z innymi software agents
  • jest zdolny automatyzować rutynowe czynności według elastycznego zbioru reguł
  • działa autonomicznie

Tłumaczenie własne za: Mandel Th., „The elements of user interface design”.

W badaniach Antonelli DeAngelli dot. stosunku użytkowników do chatterbotów wykorzystywanych w e-commerce, że klienci wyżej oceniają tego typu social interface niż tradycyjne metody komunikacji  z komputerem. Celem jaki, DeAngelli stawia przed twórcami tego typu aplikacji jest stworzenie chatterbotów wydajnych i zadowalających estetycznie oraz potrafiących nawiązywać trwałe relacje z klientami.

Projektowanie interakcji pomiędzy ludźmi a komputerem w oparciu o social interfaces to zadanie dla nauk poznawczych. Przykładem prac w tej dziedzinie jest Kismet – robot, potrafiący wyrażać emocje w odpowiedzi na słowa o znaczeniu emocjonalnym.

Koło Nauk o Poznaniu i Komunikacji, skupiające studentów kognitywistyki z UAM,  także rozpoczęło prace nad chatterbotem KNOPIK, który w zamierzeniu ma być przyjaznym interfejsem wiedzy o kognitywistyce. Na razie projekt jest w fazie rozwoju i wymaga wiele pracy, ale juz teraz jest w stanie sensownie odpowiadać na niektóre pytania związane z kognitywistyką. Zachęcam do rozmowy z nim (po angielsku)

Mapa myśli zamiast okienek

Komunikacja Człowiek-Komputer Komentarze (0) »

W ramach projektu TheBrain zaoferowany został ciekawy produkt o nazwie PersonalBrain. Projekt bazuje na idei map myśli.

Oprogramowanie (dostępne na stronie produktu) jest dostępne zarówno dla Windows’a, Linuxa i pod Mac OS.

PersonalBrain pozwala organizować informacje, zarówno ikony pulpitu jak i strony internetowe organizować zgodnie z własnymi skojarzeniami. W obszarze widzenia użytkownika pozostają tylko te informacje, które uważa on za istotne. Niewątpliwą zaletą jest dołączanie kolejnych elementów do mapy metodą drag and drop. Gdy utworzymy całość, klknięcie na dany element działa jak poruszanie się za pomocą linków.

Multimodalna komunikacja z systemem

Komunikacja Człowiek-Komputer Komentarze (0) »

W badaniu zespołu Antonelli De Angeli z The University of Manchester sprawdzano, w jaki sposób ludzie podczas wykonywania zadań z systemem komputerowym jednocześnie wydają polecenia za pomocą mowy oraz pisma.

Przy pomocy specjalnego systemu udostępniającego plan miasta, badani mieli znaleźć dom spełniający wymagania klientów oraz w drugim zadaniu, aktualizować mapę poprzez dodawanie, przemieszczanie usuwanie budynków, dróg itp. Mogli wprowadzać zapytania poprzez mikrofon oraz zaznaczać na mapie etykiety, odległości itp. System odpowiadał przedstawieniem odpowiedniej informacji na mapie.

95% biorących udział w badaniu najczęściej wykorzystywało obie możliwości wydawania poleceń dotyczących położenia przestrzennego w zadaniu aktualizacji mapy – dodawania obiektów, przenoszenia ich, modyfikowania czy zaznaczanie dwóch punktów, pomiędzy którymi odległość miała być wypisywana przez system. 20% elementów tego zadania rozwiązanych w ten sposób było kombinacją wprowadzania danych przez mikrofon i tablet LCD.

Drugą grupę poleceń, wydawanych jednocześnie poprzez mowę i zapis stanowiły: wysyłanie zapytań (np.”Czy ten dom [tu nastepowało zakreślenie obiektu] znajduje się w obszarze zagrozonym powodziami”), usuwanie obiektów, dodawanie etykiet czy przybliżanie obrazu.

W ogólnych elementach zadania (np. przewijanie wyświetlanego obrazu) które nie wymagały lokalizacji przestrzennej lub identyfikacji obiektów, badani korzystali z tylko jednej metody komunikacji np. tylko z tabletu.

Warto zaznaczyć, że komunikacja badanych z systemem zarówno za pomocą mowy, jaki i grafiki (wpisywania, zaznaczania itp.) była bardzo skuteczna, gdyż wprowadzane informacje nie powtarzały się, ani nie zakłócały lecz były komplementarne.

Czytaj cały raport z badania (ang.)


WordPress - Hosting: Twój hosting - Skórka: N.Design Studio - Spolszczenie: Adam Klimowski.
RSS wpisów RSS komentarzy Zaloguj się