Bisedat me kompjuterin tuaj mund të bëhen më realiste

Përmbajtje:

Bisedat me kompjuterin tuaj mund të bëhen më realiste
Bisedat me kompjuterin tuaj mund të bëhen më realiste
Anonim

Folje kryesore

  • Meta po përdor AI për të krijuar programe që mund të shprehin emocionet në të folur.
  • Ekipi i AI i kompanisë tha se ka bërë përparime në modelimin e vokalizimeve ekspresive, të tilla si e qeshura, gogëzimi, të qarat dhe "chat spontane" në kohë reale.
  • AI po përdoret gjithashtu për të fuqizuar përmirësimet në njohjen e të folurit.
Image
Image

Së shpejti mund të keni një bisedë më të natyrshme me kompjuterin tuaj, falë fuqisë së inteligjencës artificiale (AI).

Meta tha se ka bërë përparim të rëndësishëm në përpjekjet e saj për të krijuar sisteme më realiste të të folurit të krijuara nga AI. Ekipi i inteligjencës artificiale të kompanisë tha se ka bërë përparime në aftësinë për të modeluar vokalizime ekspresive, të tilla si të qeshurit, zverdhjet dhe të qarat, përveç "bisedës spontane" në kohë reale.

"Në çdo bisedë të caktuar, njerëzit shkëmbejnë plot sinjale joverbale, si intonacione, shprehje emocionale, pauza, thekse, ritme - të gjitha këto janë të rëndësishme për ndërveprimet njerëzore," shkroi ekipi në postimin e fundit në blog.. "Por sistemet e sotme të inteligjencës artificiale nuk arrijnë të kapin këto sinjale të pasura, ekspresive, sepse ata mësojnë vetëm nga teksti i shkruar, i cili kap atë që ne themi, por jo mënyrën se si e themi."

Fjalimi më i zgjuar

Në postimin në blog, ekipi i Meta AI tha se ata po punojnë për të kapërcyer kufizimet e sistemeve tradicionale të AI që nuk mund të kuptojnë sinjalet joverbale në të folur, si intonacionet, shprehjet emocionale, pauzat, thekset dhe ritmet.. Sistemet janë frenuar sepse mund të mësojnë vetëm nga teksti i shkruar.

Por puna e Metës ndryshon nga përpjekjet e mëparshme sepse modelet e tij të AI mund të përdorin modele të përpunimit të gjuhës natyrore për të kapur natyrën e plotë të gjuhës së folur. Studiuesit e Meta thonë se modelet e reja mund t'i lejojnë sistemet e AI të përcjellin ndjenjën që duan të përcjellin - siç është mërzia ose ironia.

"Në të ardhmen e afërt, ne do të fokusohemi në aplikimin e teknikave pa tekst për të ndërtuar aplikacione të dobishme në rrjedhën e poshtme, pa kërkuar as etiketa teksti me burime intensive ose sisteme automatike të njohjes së të folurit (ASR), si p.sh., "Si është moti?"), "shkruan ekipi në postimin në blog. "Ne besojmë se prozodia në të folur mund të ndihmojë në analizimin më të mirë të një fjalie, e cila nga ana tjetër lehtëson të kuptuarit e qëllimit dhe përmirëson performancën e përgjigjes së pyetjeve."

Kuptimi i fuqive të AI

Jo vetëm që kompjuterët po përmirësohen në komunikimin e kuptimit, por AI po përdoret gjithashtu për të fuqizuar përmirësimet në njohjen e të folurit.

Shkencëtarët e kompjuterave kanë punuar në njohjen e të folurit në kompjuter që të paktën që nga viti 1952, kur tre studiues të Bell Labs krijuan një sistem që mund të njihte shifra të vetme numerike, tha shefi i teknologjisë së AI Dynamics, Ryan Monsurate, në një email drejtuar Lifewire. Nga vitet 1990, sistemet e njohjes së të folurit ishin të disponueshme në treg, por ende kishin një shkallë gabimi që ishte mjaft e lartë për të dekurajuar përdorimin jashtë fushave shumë specifike të aplikacioneve, si p.sh. kujdesi shëndetësor.

"Tani që modelet e të mësuarit të thellë u kanë mundësuar modeleve të ansambleve (si ato nga Microsoft) të arrijnë performancë mbinjerëzore në njohjen e të folurit, ne kemi teknologjinë për të mundësuar komunikim verbal të pavarur nga altoparlanti me kompjuterë në shkallë," tha Monsurate. "Faza tjetër do të përfshijë uljen e kostos në mënyrë që të gjithë ata që përdorin Siri ose asistentët e AI të Google të kenë akses në këtë nivel të njohjes së të folurit."

Image
Image

AI është i dobishëm për njohjen e të folurit sepse mund të përmirësohet me kalimin e kohës përmes të mësuarit, tha Ariel Utnik, shefi i të ardhurave dhe menaxheri i përgjithshëm në kompaninë e zërit të AI Verbit.ai, në një intervistë me email për Lifewire. Për shembull, Verbit pretendon se teknologjia e saj inteligjente artificiale zbulon dhe filtron zhurmën e sfondit dhe jehonën dhe transkripton altoparlantët pavarësisht theksit për të gjeneruar transkriptime dhe tituj të detajuar profesional nga video dhe audio drejtpërdrejt dhe të regjistruar.

Por Utnik tha se shumica e platformave aktuale të njohjes së të folurit janë vetëm 75-80% të sakta.

"AI nuk do t'i zëvendësojë kurrë plotësisht njerëzit pasi rishikimi personal nga transkriptuesit, korrigjuesit dhe redaktorët është i nevojshëm për të siguruar një transkript përfundimtar me cilësi të lartë dhe saktësi të lartë," shtoi ai.

Njohja më e mirë e zërit mund të përdoret gjithashtu për të parandaluar hakerat, tha në një email Sanjay Gupta, nënkryetari global i produkteve dhe zhvillimit të korporatës në kompaninë e njohjes së zërit Mitek Systems. Hulumtimet tregojnë se brenda dy viteve, 20 për qind e të gjitha sulmeve të suksesshme të marrjes së llogarisë do të përdorin shtim sintetik të zërit, shtoi ai.

"Kjo do të thotë që ndërsa teknologjia e rreme e thellë bëhet më e sofistikuar, ne duhet të krijojmë njëkohësisht siguri të avancuar që mund të luftojë këto taktika krahas falsifikimeve të thella të imazheve dhe videove," tha Gupta. "Luftimi i mashtrimit të zërit kërkon teknologjinë e zbulimit të gjallërisë, e aftë për të dalluar midis një zëri të drejtpërdrejtë dhe një versioni të regjistruar, sintetik ose të gjeneruar nga kompjuteri të një zëri."

Korrigjim 2022-05-04: Korrigjoi drejtshkrimin e emrit të Ryan Monsurate në paragrafin 9.

Recommended: