Folje kryesore
- DeepZen përdor AI (inteligjencë artificiale) për të krijuar libra audio befasues realistë nga teksti.
- Teknologjia përdor aktorë të vërtetë të zërit njerëzor për të siguruar blloqet e ndërtimit.
- Amazon dhe Audible nuk pranojnë aktualisht libra audio të krijuar nga kompjuteri.
DeepZen është një kompani që krijon zëra kompjuterikë të përdorur në libra audio, bazuar në zërat e vërtetë të aktorëve njerëzorë. Cilësia është e frikshme - mjaft e mirë për t'u dëgjuar për orë të tëra në të njëjtën kohë. Mashtrimi këtu është komponenti i AI (inteligjencës artificiale), i cili mund të lexojë tekstin dhe të nxjerrë përgjigjen e saktë emocionale bazuar në kontekst. Më pas e vendos atë emocion në zë.
Është mbresëlënës dhe shumë i përshtatshëm. Por a duam vërtet një përvojë të homogjenizuar të librit audio? Po ata aktorë zëri?
"Nga këndvështrimi i botuesit indie, çdo gjë që ul koston e prodhimit të librave audio është shumë interesante," tha Rick Carlile, pronar i botuesit të pavarur Carlile Media, për Lifewire përmes emailit.
"Por kjo tërheqje supozon se produkti do të ishte i cilësisë së njëjtë me rrëfimin tradicional. Unë nuk mendoj se jemi qind për qind atje. Mos më keqkuptoni, DeepZen është çuditërisht i mirë. Është një zbulim i jashtëzakonshëm dhe krijuesit e tij meritojnë lavdërime dhe sukses të jashtëzakonshëm. Por nuk është ende perfekt."
Audio që është 'mjaft e mirë'
Mënyra më e mirë për të kuptuar cilësinë e DeepZen është të dëgjoni mostrat. Nëse nuk e dinit se janë krijuar nga kompjuteri, mund të mos e kuptonit as. Gjithsesi jo për një kohë. Le të supozojmë se AI i DeepZen është perfekt dhe se kurrë nuk i keqinterpreton notat emocionale që supozohet të ketë.
Edhe atëherë, një njeri mund të ofrojë interpretime më të nuancuara dhe shpesh më befasuese. Një aktor mund të bëjë një kthesë të papritur në fjalët që një kompjuter as që do t'i merrte në konsideratë. Dhe në realitet, interpretimi i AI me siguri nuk është ende aq i mirë sa ai i një aktori profesionist.
"Si ai që punon në filma dhe së fundmi në botën e transmetimit audio, ndërsa jam i impresionuar me AI-e di me të vërtetë se ka thellësi të thella kuptimi që një makinë nuk mund t'i interpretojë," zëri profesionist aktori Paul Cram i tha Lifewire përmes emailit.
"A do të ketë një rritje të autorëve të panjohur duke e përdorur atë? Unë garantoj se do të ketë sepse është 'mjaft e mirë'."
Të jesh mjaftueshëm i mirë, i kombinuar me komoditetin dhe kursimet e kostos, mund të mjaftojë për të nxitur botuesit indie drejt shërbimit.
"Librat audio mund të kushtojnë deri në 500 dollarë për orë të përfunduar audio (shumë më shumë për një zë të famshëm), dhe kjo nuk përfshin koston e kohës së menaxhimit dhe administratorit," thotë Carlile. "Të jesh në gjendje ta përgjysmosh atë kosto duke ngarkuar thjesht një dorëshkrim te një ofrues si DeepZen është jashtëzakonisht tërheqëse."
Probleme me të folur
Nuk është ende aq e lehtë sa të shkarkosh aktorët e zërit dhe të ngarkosh dorëshkrime në DeepZen. Aktualisht ekziston një pengesë për fjalimin e lehtë të librit audio me AI, dhe është nga Amazon.
"Aktualisht, ACX, rruga e vetë-publikuesit drejt shpërndarjes së librave audio Audible dhe Amazon, nuk do të pranojë libra audio që një njeri nuk i ka regjistruar," thotë Carlile.
Pse? Cilësia. Këtu është hyrja FAQ nga faqja e internetit:
"Tekst në fjalim ose regjistrime të tjera të automatizuara nuk lejohen. Dëgjuesit me zë zgjedhin libra audio për performancën e materialit, si dhe tregimin. Për të përmbushur këtë pritshmëri, libri juaj audio duhet të regjistrohet nga një njeri."
Kjo do të thotë se librat audio të gjeneruar nga DeepZen nuk kanë dalë për momentin, të paktën. Ky është spekulim i pastër, por DeepZen do të duket si një blerje mjaft e mirë për Amazon, duke e lënë atë të shesë shërbimin dhe ta mbajë atë vetëm për librat Audible. Dhe edhe nëse kjo nuk ndodh, nëse cilësia e librave audio të gjeneruar nga kompjuteri është aq e mirë sa kjo, atëherë duket se ka pak arsye për të mos bërë përjashtim nga ky rregull.
A do të ishit të lumtur të dëgjoni libra audio të krijuar në këtë mënyrë? Kur të ndodhë, shumica e njerëzve as nuk do të dyshojnë. Disa mund të preferojnë përsosmërinë e zërave të gjeneruar nga kompjuteri, sepse ata do të jenë të lirë nga tik-at vokale dhe zakonet që ndonjëherë mund të shpërqendrojnë. Teknologjia është gjithashtu e përshtatshme për lojëra video, reklama televizive dhe radio, dhe çdo skenar tjetër ku do të punësoni një aktor zanor.
Teknologjia e DeepZen do të ishte gjithashtu një mënyrë e shkëlqyeshme për të krijuar automatikisht podkaste lajmesh nga artikuj të shkruar, të cilët mund të jenë të dobishëm për udhëtimin.
Po në lidhje me ata aktorë zëri? Epo, do të ketë të paktën një mundësi: Ata mund të shkojnë dhe të punojnë për DeepZen.