“Google DeepMind” jaunā MI tehnoloģija ģenerēs skaņu celiņus videoklipiem

“Google” piederošā mākslīgā intelekta (MI) kompānija “DeepMind” paziņojusi, ka strādā pie jaunas tehnoloģijas, kas var ģenerēt skaņu celiņus, ieskaitot pat dialogus, ko pēc tam var pievienot videoklipiem. Uzņēmuma izstrādātā video uz audio (V2A) tehnoloģija var sastrādāties “Google Veo” un citiem video veidošanas rīkiem, piemēram, “OpenAI Sora“.

Savā paziņojumā “DeepMind” skaidro, ka sistēma var saprast neapstrādātus pikseļus un apvienot šo informāciju ar teksta uzvednēm, lai radītu skaņas efektus, kas ir atbilstoši videoklipā redzamajam. Jāpiemin, ka šo tehnoloģiju var izmantot, lai izveidotu skaņu celiņus arī, piemēram, mēmajām filmām vai videoklipiem bez skaņas.

Reklāma

“DeepMind” pētnieki trenēja šo V2A tehnoloģiju uz video, audio un MI ģenerētām anotācijām, kas satur detalizētus skaņu aprakstus un dialogu transkriptus. Šādā veidā tehnoloģija tika apmācīta sasaistīt konkrētas skaņas ar vizuālām ainām. Būtiski, ka līdzīgus risinājumus piedāvā arī citi uzņēmumi, piemēram, “ElevenLabs”. Taču “DeepMind” uzsver, ka pašu radītā tehnoloģija atšķiras tieši ar spēju darboties ar neapstrādātiem pikseļiem un to, ka teksta uzvedņu pievienošana nav obligāta. Tiesa, teksta uzvedni ir labi pievienot, jo šādā veidā skaņu celiņi būs precīzāki un reālistiskāki.

Segway Navimow i105E zāles pļāvēja robota apskats

Mercusys HALO H80X Wi-Fi 6 bezvadu režģtīkla ierīču apskats

POCO F6 viedtālruņa apskats – vai var iztikt bez “Pro”?

Sony ULT Wear bezvada austiņu apskats

Porsche atsauc visus pasaulē pārdototos Taycan, lai novērstu bremžu defektu

Jaudīgāks nekā jebkad iepriekš – Volkswagen prezentē modernizēto Golf R

Prezentēts jaunais BMW M5 ar M HYBRID elektrificēto piedziņas sistēmu

Hyundai prezentē Inster – subkompaktās klases elektromobili 355 km sniedzamību

Logitech G515 — nākamās paaudzes, zema profila tastatūra augstas veiktspējas spēlēm

AGON by AOC ar lepnumu prezentē AOC GAMING C27G4ZXE – izliektu 27 collu FHD monitoru ar 280 Hz atsvaidzi

Philips 49B2U6903CH monitors piedāvā savienojamības un produktivitātes apvienojumu profesionālai darba videi

Izziņots AOC GAMING C27G2Z3/BK ieliektais monitors ar 280 Hz atsvaidzi

Ko Kursors Tev Neraksta #93 + Kārlis Bardelis

Ko Kursors Tev Neraksta #92

Ko Kursors Tev Neraksta #91 + Artis Daugins (Blue Shock Race)

Ko Kursors Tev Neraksta #90

Logitech MX ERGO datorpeli konkurss (noslēdzies)

Pastāsti, kādu lietoto datoru vēlies iegādāties un laimē iespaidīgu atlaidi (noslēdzies)

Piedalies Kursors.lv konkursā un laimē Nothing Ear (2) bezvadu austiņas (noslēdzies)

Piedalies Kursors.lv konkursā un laimē Focusrite Vocaster Two Studio (noslēdzies)

“Google DeepMind” jaunā MI tehnoloģija ģenerēs skaņu celiņus videoklipiem

Jaunākie raksti

“Amazon” tirgus vērtība pirmo reizi sasniegusi 2 triljonus dolāru

“Google”, izmantojot mākslīgo intelektu, pievieno “Translate” servisam vēl 110 valodas

Verizon saņēmis 1 miljonu dolāru sodu par ārkārtas palīdzības zvanu nenodrošināšanu

Japānas sportisti Olimpisko spēļu laikā vilks speciālus tērpus, lai traucētu izvirtuļiem

Segway Navimow i105E zāles pļāvēja robota apskats