Met ‘AlterEgo’ zit het internet voortaan tussen uw oren.

Wanneer je stemmen hoort in je hoofd, kun je maar beter een dokter raadplegen. Alhoewel dat binnenkort misschien niet zo ‘gek’ meer zal zijn. Uw AlterEgo luistert mee, doet wat je vraagt en geeft feedback. AlterEgo is namelijk een draagbaar (niet-invasief), spraaksysteem voor “stille” en naadloze communicatie met computers en andere mensen.

Van TV-zender wisselen? De lichten dimmen? Gordijnen sluiten? De eindscore van het Wereldkampioenschap Voetbal van Mexico ’86 herinneren? Gewoon jezelf in stilte (in uzelf) de vraag stellen en de (zoek- of doe-)opdracht wordt uitgevoerd.

Science fiction? Nope. AlterEgo, gemaakt door MIT Media Lab afgestudeerde Arnav Kapur, maakt dit al mogelijk. (MIT: Massachusetts Institute of Technology).

alterego_picture1final-LL
Arnav Kapur (credits: Arnav Kapur, Neo Mohsenvand)

Kapur’s apparaat  (3D geprint) gaat niet meteen de prijs voor het beste design winnen. De  vorm was dan ook niet zijn prioriteit, wel de technologie te laten werken.  Ze geloven dat ze het draagbare toestel haast onopvallend zullen kunnen maken. Google Glass was een mooi voorbeeld van hoe de massa (nog) niet klaar is voor opzichtige wearables (voor velen ‘gadgets’).

Op dit moment is er een werkend prototype dat, na training met gebruikersspecifieke voorbeeldgegevens, meer dan 90% nauwkeurigheid laat zien op een toepassingsspecifieke woordenschat. Daar zit nog een deel van het probleem. Het is pas iets voor mainstream gebruik wanneer de  individuele training niet moet of tot een minimum beperkt kan worden.

“Ik voel me wel een cyborg, maar in de best mogelijke zin,” zegt Kapur over zijn ervaring met het apparaat, dat hij als onderzoeksproject bouwde.

AlterEgo wil de menselijke intelligentie vergroten en computer-, internet- en machine-intelligentie tot een natuurlijke uitbreiding van de eigen cognitie van de gebruiker maken. Het doet dat door een stil, discreet en naadloos gesprek tussen persoon en machine mogelijk te maken.

Hoe werkt het?

Het draagbare systeem leest elektrische impulsen af van het huidoppervlak die optreden wanneer een gebruiker intern woorden of zinnen spreekt – zonder spraak, stem of waarneembare bewegingen. 

21769396_10209598415349393_744165758_o

Stil spreken is iets anders dan woorden bedenken of woorden hardop uitspreken.  Stil spreken is een bewuste poging om een woord te zeggen, gekenmerkt door subtiele bewegingen van interne spraakorganen zonder het daadwerkelijk te uiten. Het proces resulteert in signalen van uw hersenen naar uw spieren die worden opgepikt als neuromusculaire signalen en verwerkt door het AlterEgo apparaat. De elektroden van AlterEgo sturen de signalen via Bluetooth door naar een computer, waar ze door algoritmen kunnen worden gedecodeerd en vervolgens kunnen worden geactiveerd (“licht dimmen” bijvoorbeeld).

Het systeem kan u ook feedback geven, en ook dat is niet waarneembaar voor derden. De communicatie verloopt via een hoofdtelefoon met botgeleiding (met een computergestuurde stem).

Het is net alsof je persoonlijk verbonden bent met het internet zonder ‘naar het internet te gaan’. Vroeger gingen we ‘naar het internet’, door ons aan onze computer te zetten. Het internet ‘op te zetten’, verbinding te maken en naar ‘het geluid’ te luisteren. Wat modern dat dat internet tegenwoordig dankzij de smartphone in ieders binnenzak steekt. Kijken we ooit terug en zeggen  we glimlachend: ’weet je nog, dat we destijds steeds onze smartphone moesten vastnemen en iets opzoeken?’, want met AlterEgo zit het internet voortaan tussen onze oren.

Storend gedrag

Een van de redenen waarom de smartphones van vandaag storend zijn, is dat ze omslachtig in het gebruik zijn en de aandacht van de gebruiker verschuift om het apparaat te raadplegen. Met AlterEgo heeft de gebruiker moeiteloos en dus minder sociaal storend toegang tot de uitgebreide informatie en diensten die online beschikbaar zijn, zodat de gebruiker geen regelmatige activiteiten hoeft te onderbreken om met een computer te communiceren.

Het is ook minder ‘aanwezig’ dan wanneer je luidop spraakcommando’s richting Alexa, Siri of andere digitale Assistenten uitspreekt.

Angst

Artificiële Intelligentie ontwikkelt zich ontzettend snel en is bij velen een bron van angst aan het worden. Houden we het wel onder controle? Neemt het onze jobs af?

Kapur ziet AlterEgo als een soort tegengif. Het afgelopen jaar heeft hij aan het apparaat gewerkt om te laten zien hoe AI ons kan helpen met verbeteren in plaats van vervangen. Een filosofie die Elon Musk ook hanteert en daartoe speciaal Neuralink heeft opgericht; alhoewel zij meer lijken in te zetten op invasieve oplossingen, bijv. het inplanten van chips in de hersenen.

Is dit wel nieuw?

Zowel in de academische wereld als in het bedrijfsleven is er een lange geschiedenis van onderzoek naar communicatie tussen hersenen en computers. Je kan die onderverdelen in twee groepen, de invasieve (geïmplanteerd) of niet-invasieve (extern).

In de categorie niet-invasieve hersencomputersystemen zijn de meeste benaderingen gebaseerd op het rechtstreeks uitlezen van informatie uit de hersenen met behulp van sensoren op de schedel. Hoewel deze systemen niet invasief zijn, zijn ze nog steeds indringend in die zin dat het systeem direct toegang heeft tot hersenactiviteit. Een apparaat dat zou functioneren als een dagelijkse computationele interface heeft best geen toegang tot iemands persoonlijke gedachten.

AlterEgo is gericht op het bouwen van een apparaat dat zowel niet-invasief als niet-indringend is, waarbij de input naar het computerapparaat een doelbewuste en gestroomlijnde input is van een deel van de menselijke gebruiker, waarbij de menselijke gebruiker de absolute controle heeft over welke informatie ze naar een andere persoon / computer zendt.

De gedachten die de gebruiker oproept, worden niet gelezen, alleen de gedachten die de gebruiker bewust naar het apparaat wil sturen, zodat de gebruiker zijn of haar gedachten privé kan houden.

Gedachten lezen
?

Dus neen, dit apparaat kan uw gedachten niet lezen. De nieuwigheid van dit systeem is dat het signalen van uw gezichts- en stembandspieren leest wanneer u opzettelijk en geruisloos woorden uitspreekt. Het systeem heeft geen directe en fysieke toegang tot hersenactiviteit en kan daarom de gedachten van een gebruiker niet lezen. Het apparaat leest alleen woorden die bewust stil gesproken worden als input.

Waarom zou iemand zo’n apparaat willen gebruiken?

We leven in een wereld waarin we vaak met een computer in aanraking komen, maar dat gaat ten koste van onze dagelijkse persoonlijke communicatie en/of onze privacy. AlterEgo stelt gebruikers in staat om naadloos en efficiënt te communiceren met hun computerapparatuur zonder de verbinding met hun omgeving te verbreken of zelfs hun interacties in de praktijk te verstoren. AlterEgo zet de rekenkracht van een gebruiker zelf in. Het gebruikt het denken en stil praten, in plaats van typende vingertoppen.

Zo kunnen  gebruikers moeiteloos met een computer communiceren en hun ideeën vastleggen, privé-berichten versturen, informatie opzoeken en (letterlijk) hoofdrekenen …

Hoofdrekenen
Tijdens het winkelen de bedragen onthouden en laten optellen. Via botgeleiding krijg je auditief het antwoord (via computerstem).

Bruikbaar?

Dit platform stelt een menselijke gebruiker in staat om verbinding te maken met het internet, en de kennis van het web in real-time te gebruiken als parate kennis.

Het platform opent een breed scala aan mogelijkheden. Een gebruiker kan een Google-query (zoekopdracht) intern vocaliseren  en een daaruit voortvloeiend antwoord krijgen. Dat antwoord komt auditief binnen door middel van botgeleiding, dus zonder enige waarneembare actie. Derden horen de auditieve feedback niet.

Het systeem fungeert als een digitaal geheugen; de gebruiker kan intern informatiestromen opnemen en deze op een later tijdstip via het systeem opvragen.

Ben je op een netwerk-event en denk je ‘Goh hoe heet die nu ook alweer?’ (been there, done that), dan denk je er gewoon even aan en uw AlterEgo zal u redden, zonder de verlegenheid die voortkomt uit het openlijk vragen naar die informatie.

Het systeem stelt een menselijke gebruiker in staat Internet of Things (IoT) en andere apparaten te bedienen  zonder enige waarneembare actie.  Lichten uit? Gewoon even stil uitspreken;… klaar.

Het systeem zou mogelijk mensen met  spraakstoornissen kunnen helpen.  Maar dat moeten ze nog formeel en uitgebreid onderzoeken.

Stille taal als tolkmiddel

Wanneer de AlterEgo verbonden wordt met een Bluetoothspeaker, kan de gebruiker een uitdrukking intern vocaliseren, in de eigen denktaal, en zal het systeem dit vertalen naar een andere taal, om een meertalig gesprek te voeren.

Wanneer Trump en Kim Jong-un nog eens samen keuvelen over het nucleaire lot van onze aardbol, dan hoeven er geen tolken meer nerveus naast zitten schuifelen. De gedachten worden omgezet in de taal van de tegenpartij; via de Bluetoothspeaker.

Alhoewel, momenteel kan de AlterEgo nog alleen maar  stilzwijgend woorden uit het Engels vertalen naar Spaans en Japans en is het nog beperkt tot 15 zinnen vertalen. Dat komt omdat de benadering van stille spraak nieuw is, dus zijn er geen grote datasets die de onderzoekers kunnen hanteren om het algoritme van AlterEgo te trainen (in tegenstelling tot bijvoorbeeld een typische spraakherkenningsapp).

Ik hoor u denken

Van persoon-tot-persoon-in-stilte-communiceren gaat ook, wanneer beiden een AlterEgo hanteren. Een blik naar iemand werpen zegt non-verbaal soms al veel, maar binnenkort kunnen daar woorden bijgevoegd worden. Nu is de persoon-tot-persoon-communicatiefunctie nog beperkt tot zeer eenvoudige woorden en zinnen zoals “Ja”, “Nee”, “Hallo”, “Bye” en “Weet je dit”?

#WhatsNext

Wij denken natuurlijk graag al even vooruit, en dan zien wij een toekomst mogelijk waarin artsen intern en stil een klinisch besluitvormend gesprek voeren met een specialist, die bestaat uit een AI, gespecialiseerd in de materie waarmee de arts geconfronteerd wordt.

Door de user interface (stil praten, botgeleiding) hoeft de arts geen zichtbare opzoekingen te doen, wat het vertrouwen verhoogt, de interactie verbetert en versnelt.

Zit je nog eens in een vergadering en termen als API, KPI, YTD,… vliegen om uw oren terwijl je het in Keulen hoort donderen? Luister dan even naar jezelf, stel de vraag aan jezelf, en AlterEgo zoekt het discreet voor je op.

Heb je een gesprek met je bankier, blijkt die opeens in alle domeinen gespecialiseerd. Met AlterEgo weet je niet of de adviseur uit parate kennis put, dan wel volop in gedachte aan het online surfen is.  Maar handig wordt het wel.

Verkrijgbaarheid

Met de AlterEgo uitpakken op een volgend bedrijfsfeestje of meeting? Dat moet nog even wachten.
Dit is een onderzoeksproject op universitair niveau. Ze blijven het systeem verder ontwikkelen, waarbij ze zich richten op verbeteringen zoals het verminderen van het aantal benodigde elektroden, het ontwerpen van sociaal acceptabelere vormfactoren en het verbeteren van de neurale netwerken die de stille spraak herkennen.

Ook het verminderen van de benodigde training en maatwerk is een te overwinnen obstakel. En natuurlijk, nadien moeten er nog toepassingen komen met een end-to-end gebruikerservaring. Eventuele commercialisering is voorbarig maar het is een innovatie om in de gaten te houden… (flauwe mop alert) “we blijven er aan denken”.

Steven Dupont 

#WhatsNext is een Technologie- en Innovatieblog in mensentaal. Op de hoogte blijven? Volg ons op:

3 reacties

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s

%d bloggers liken dit: