Meta випускає «відкриту» версію генератора подкастів Google
Meta запускає відкриту реалізацію популярної функції генерації подкастів, відомої з Google NotebookLM.
Проект під назвою NotebookLlama використовує власні мовні моделі Meta, зокрема Llama. Подібно до NotebookLM, він може генерувати діалоги в стилі подкасту на основі завантажених текстових файлів.
NotebookLlama спочатку створює транскрипцію з файлу, наприклад, PDF-файлу статті або блогу. Потім він додає "більше драматизму" та переривань, перш ніж передати транскрипцію відкритим моделям перетворення тексту в мову.
Про це йдеться в публікації scitechdaily.com
Результати звучать не так добре, як у NotebookLM. У прикладах NotebookLlama, які я прослухав, голоси мають дуже очевидну роботизовану якість і часто перебивають один одного в незручні моменти.
Однак дослідники Meta, які стоять за проектом, стверджують, що якість можна покращити за допомогою більш потужних моделей.
"Модель перетворення тексту в мову обмежує природність звучання", - написали вони на сторінці NotebookLlama на GitHub. "[Крім того], іншим підходом до написання подкасту може бути створення двох агентів, які дебатують на цікаву тему і пишуть план подкасту. Зараз ми використовуємо одну модель для написання плану подкасту".
NotebookLlama не є першою спробою відтворити функцію подкасту NotebookLM. Деякі проекти були більш успішними, ніж інші. Але жоден з них, навіть сам NotebookLM, не зміг вирішити проблему галюцинацій, яка характерна для всіх моделей ШІ. Тобто, AI-генеруювані подкасти неминуче міститимуть деякі вигадані елементи.
Meta зі своїм проектом NotebookLlama зробила значний крок у напрямку відкритості та доступності технологій генеративного ШІ. Хоча якість синтезованої мови ще потребує вдосконалення, сама ідея створення інструменту, який дозволяє перетворювати текстові документи на подкасти, є надзвичайно перспективною.
Цей проект демонструє, як швидко розвивається галузь ШІ та як відкриті дослідження можуть пришвидшувати цей процес. Однак, як і будь-яка технологія, що базується на ШІ, NotebookLlama має свої обмеження, зокрема, схильність до галюцинацій. Незважаючи на це, проект відкриває нові можливості для створення контенту та демонструє, як ШІ може змінювати способи, якими ми споживаємо інформацію.
Ключові слова: ші, мета, технології
------
Автор - Andrii Dydyk для RSSHub ( rss.lviv.ua)