Së shpejti, mund të mos e dini se po flisni me një kompjuter

Përmbajtje:

Së shpejti, mund të mos e dini se po flisni me një kompjuter
Së shpejti, mund të mos e dini se po flisni me një kompjuter
Anonim

Folje kryesore

  • Po afrohet shpejt dita kur nuk do të jeni në gjendje të dalloni fjalimin e krijuar nga kompjuteri nga ajo e vërtetë.
  • Google zbuloi së fundi LaMDA, një model që mund të lejojë biseda më të natyrshme.
  • Prodhimi i të folurit si njeriu kërkon gjithashtu një sasi të madhe fuqie përpunuese.
Image
Image

Për momentin, është e lehtë të dallosh kur po flet me një kompjuter, por kjo mund të ndryshojë së shpejti falë përparimeve të fundit në AI.

Google zbuloi së fundmi LaMDA, një model eksperimental për të cilin kompania pretendon se mund të rrisë aftësinë e asistentëve të tij bisedues të AI dhe të lejojë biseda më të natyrshme. LaMDA synon që përfundimisht të bisedojë normalisht për pothuajse çdo gjë pa asnjë lloj trajnimi paraprak.

Është një nga një numër në rritje i projekteve të AI që mund t'ju lërë të pyesni veten nëse jeni duke folur me një qenie njerëzore.

"Përllogaritja ime është se brenda 12 muajve të ardhshëm, përdoruesit do të fillojnë të ekspozohen dhe të mësohen me këto zëra të rinj, më emocionues," James Kaplan, CEO i MeetKai, një asistent dhe kërkimi virtual i AI-së për biseda. motori, tha në një intervistë me email.

"Sapo të ndodhë kjo, fjalimi i sintetizuar i sotëm do t'u tingëllojë përdoruesve ashtu siç tingëllon ne sot fjalimi i fillimit të viteve 2000."

Asistentë zanor me karakter

LaMDA e Google është ndërtuar mbi Transformer, një arkitekturë e rrjetit nervor e shpikur nga Google Research. Ndryshe nga modelet e tjera të gjuhëve, LaMDA e Google u trajnua për dialog të vërtetë.

Pjesë e sfidës për të bërë fjalim me tingull natyral të AI është natyra e hapur e bisedave, shkroi Eli Collins i Google në një postim në blog.

Image
Image

"Një bisedë me një mik për një shfaqje televizive mund të evoluojë në një diskutim rreth vendit ku u filmua seriali përpara se të vendosej për një debat rreth kuzhinës më të mirë rajonale të atij vendi," shtoi ai.

Gjërat po ecin shpejt me fjalimin e robotëve. Eric Rosenblum, një partner menaxhues në Tsingyuan Ventures, i cili investon në inteligjencën artificiale bisedore, tha se disa nga problemet më themelore në të folurit e ndihmuar nga kompjuteri janë zgjidhur praktikisht.

Për shembull, shkalla e saktësisë në të kuptuarit e të folurit është tashmë jashtëzakonisht e lartë në shërbime të tilla si transkriptimet e bëra nga softueri Otter.ai ose shënimet mjekësore të marra nga DeepScribe.

"Kufiri tjetër, megjithatë, është shumë më i vështirë," shtoi ai.

"Ruajtja e të kuptuarit të kontekstit, i cili është një problem që shkon përtej përpunimit të gjuhës natyrore, dhe ndjeshmërisë, siç janë kompjuterët që ndërveprojnë me njerëzit, duhet të kuptojnë zhgënjimin, zemërimin, padurimin, etj. Të dyja këto çështje janë duke u punuar, por të dyja janë shumë larg nga të qenit të kënaqshme."

Rrjetet nervore janë çelësi

Për të gjeneruar zëra të ngjashëm me jetën, kompanitë po përdorin teknologji si rrjetet nervore të thella, një formë e të mësuarit të makinerive që klasifikon të dhënat përmes shtresave, Matt Muldoon, president i Amerikës së Veriut në ReadSpeaker, një kompani që zhvillon softuer tekst-në të folur. tha në një intervistë me email.

"Këto shtresa përsosin sinjalin, duke e renditur atë në klasifikime më komplekse," shtoi ai. "Rezultati është të folurit sintetik që tingëllon çuditërisht si një njeri."

Një teknologji tjetër në zhvillim është Prosody Transfer, e cila përfshin kombinimin e tingullit të një zëri tekst-në-fjalë me stilin e të folurit të një tjetri, tha Muldoon. Ekziston edhe transferimi i të mësuarit, i cili redukton sasinë e të dhënave të trajnimit të nevojshme për të prodhuar një zë të ri nervor të tekstit në të folur.

Kaplan tha se prodhimi i të folurit të ngjashëm me njeriun kërkon gjithashtu sasi të mëdha fuqie përpunuese. Kompanitë po zhvillojnë çipa përshpejtues nervorë, të cilët janë module të personalizuara që funksionojnë në lidhje me procesorët e rregullt.

"Faza tjetër në këtë do të jetë vendosja e këtyre çipave në pajisje më të vogla, pasi aktualisht është bërë tashmë për kamerat kur kërkohet AI për vizion," shtoi ai. "Nuk do të kalojë shumë kohë përpara se kjo lloj aftësie kompjuterike të jetë e disponueshme në vetë kufjet."

Një sfidë për zhvillimin e të folurit të drejtuar nga AI është se të gjithë flasin ndryshe, kështu që kompjuterët priren ta kenë të vështirë të na kuptojnë.

"Mendoni thekset Georgia kundër Bostonit kundër Dakotës së Veriut dhe nëse anglishtja është gjuha juaj kryesore apo jo," tha në një email Monica Dema, e cila punon në analitikën e kërkimit zanor në MDinc. "Duke menduar globalisht, është e kushtueshme ta bësh këtë për të gjitha rajonet e Gjermanisë, Kinës dhe Indisë, por kjo nuk do të thotë se nuk është ose nuk mund të bëhet."

Recommended: