Folje kryesore
- Një model i ri i mësimit të makinerive halucinon një imazh të paraqitjes së një fjalie në një gjuhë për të ndihmuar përkthimin.
- Sistemi i AI, i quajtur VALHALLA, u krijua për të imituar mënyrën se si njerëzit e perceptojnë gjuhën.
- Sistemi i ri është pjesë e një lëvizjeje në rritje për të përdorur AI për të kuptuar gjuhën.
Metoda njerëzore e vizualizimit të fotografive gjatë përkthimit të fjalëve mund të ndihmojë inteligjencën artificiale (AI) t'ju kuptojë më mirë.
Një model i ri i mësimit të makinerive halucinon një imazh se si duket një fjali në një gjuhë. Sipas një studimi të fundit kërkimor, teknika më pas përdor vizualizimin dhe të dhëna të tjera për të ndihmuar me përkthimin. Është pjesë e një lëvizjeje në rritje për të përdorur AI për të kuptuar gjuhën.
"Si njerëzit flasin dhe shkruajnë është unike sepse ne të gjithë kemi tone dhe stile paksa të ndryshme," tha Beth Cudney, një profesore e analitikës së të dhënave në Universitetin Maryville, e cila nuk ishte e përfshirë në kërkim, në një intervistë për Lifewire.. "Të kuptosh kontekstin është e vështirë sepse është si të merresh me të dhëna të pastrukturuara. Këtu është i dobishëm përpunimi i gjuhës natyrore (NLP). NLP është një degë e AI që trajton ndryshimet në mënyrën se si ne komunikojmë duke përdorur të kuptuarit e leximit të makinës. Dallimi kryesor në NLP, si një degë e AI, nuk fokusohet thjesht në kuptimet e mirëfillta të fjalëve që ne flasim ose shkruajmë. Ai shikon kuptimin."
Shko Pyet Alice
Sistemi i ri i AI, i quajtur VALHALLA, i krijuar nga studiues nga MIT, IBM dhe Universiteti i Kalifornisë në San Diego, u krijua për të imituar mënyrën se si njerëzit e perceptojnë gjuhën. Sipas shkencëtarëve, përdorimi i informacionit shqisor, si multimedia, i shoqëruar me fjalë të reja dhe të panjohura, si kartat me imazhe, përmirëson përvetësimin dhe mbajtjen e gjuhës.
Këto sisteme po rrisin fuqinë e chatbots që aktualisht janë vetëm të trajnuar dhe të aftë për biseda specifike…
Ekipi pretendon se metoda e tyre përmirëson saktësinë e përkthimit me makinë në krahasim me përkthimin vetëm me tekst. Shkencëtarët përdorën një arkitekturë enkoder-dekoder me dy transformatorë, një lloj modeli i rrjetit nervor i përshtatshëm për të dhëna të varura nga sekuenca, si gjuha, që mund t'u kushtojë vëmendje fjalëve kyçe dhe semantikës së një fjalie. Një transformator gjeneron një halucinacion vizual dhe tjetri kryen përkthim multimodal duke përdorur daljet nga transformatori i parë.
"Në skenarët e botës reale, ju mund të mos keni një imazh në lidhje me fjalinë burimore," tha Rameswar Panda, një nga anëtarët e ekipit kërkimor, në një njoftim për shtyp. "Pra, motivimi ynë ishte në thelb: në vend që të përdorim një imazh të jashtëm gjatë përfundimit si hyrje, a mund të përdorim halucinacionin vizual - aftësinë për të imagjinuar skena vizuale - për të përmirësuar sistemet e përkthimit me makinë?"
Kuptimi i AI
Kërkim i konsiderueshëm është i fokusuar në avancimin e NLP-së, vuri në dukje Cudney. Për shembull, Elon Musk bashkëthemeloi Open AI, i cili po punon në GPT-3, një model që mund të bisedojë me një njeri dhe është mjaft i zgjuar për të gjeneruar kode softuerësh në Python dhe Java.
Google dhe Meta po punojnë gjithashtu për të zhvilluar AI bisedore me sistemin e tyre të quajtur LAMDA. "Këto sisteme po rrisin fuqinë e chatbot-eve që aktualisht janë vetëm të trajnuar dhe të aftë për biseda specifike, të cilat ka të ngjarë të ndryshojnë fytyrën e tavolinave të mbështetjes së klientit dhe ndihmës," tha Cudney.
Aaron Sloman, bashkëthemeluesi CLIPr, një kompani e teknologjisë AI, tha në një email se modelet e mëdha gjuhësore si GPT-3 mund të mësojnë nga shumë pak shembuj trajnimi për të përmirësuar përmbledhjet e tekstit bazuar në reagimet njerëzore. Për shembull, tha ai, ju mund t'i jepni një modeli të madh gjuhësor një problem matematikor dhe t'i kërkoni AI të mendojë hap pas hapi.
"Mund të presim që njohuri dhe arsyetime më të mëdha të nxirren nga modelet e mëdha gjuhësore ndërsa mësojmë më shumë rreth aftësive dhe kufizimeve të tyre," shtoi Sloman. "Unë gjithashtu pres që këto modele gjuhësore të krijojnë më shumë procese të ngjashme me njeriun ndërsa modeluesit zhvillojnë mënyra më të mira për të rregulluar modelet për detyra specifike me interes."
Profesori i informatikës në Georgia Tech, Diyi Yang, parashikoi në një intervistë me email se do të shohim më shumë përdorim të sistemeve të përpunimit të gjuhës natyrore (NLP) në jetën tonë të përditshme, duke filluar nga asistentët e personalizuar të bazuar në NLP për të ndihmuar me email dhe telefonata, për sistemet e dialogut të ditur për kërkimin e informacionit në udhëtime ose kujdes shëndetësor."Si dhe sistemet e drejta të AI që mund të kryejnë detyra dhe të ndihmojnë njerëzit në një mënyrë të përgjegjshme dhe pa paragjykime," shtoi Yang.
Modele të mëdha të AI që përdorin triliona parametra si GPT-3 dhe DeepText do të vazhdojnë të punojnë drejt një modeli të vetëm për të gjitha aplikacionet gjuhësore, parashikoi Stephen Hage, një inxhinier i mësimit të makinerive në Dialexa, në një intervistë me email. Ai tha se do të ketë gjithashtu lloje të reja modelesh të krijuara për përdorime specifike, të tilla si blerjet online të komanduara me zë.
"Një shembull mund të jetë një blerës që thotë "Më trego këtë rimel në blu të mesnatës me më shumë halo", për të treguar atë nuancë në sytë e personit me njëfarë kontrolli mbi mënyrën se si zbatohet," shtoi Hage.