Беларускія распрацоўшчыкі стварылі першае беларускамоўнае радыё на аснове штучнага інтэлекту.
Насамрэч у эфіры такога радыё штучны інтэлект пакуль проста ставіць беларускія песні і расказвае пра іх слухачам. Дадаваць навінавую павестку распрацоўшчыкі пакуль не плануюць — а вось казкі для дзяцей у вячэрнім эфіры хутка могуць з’явіцца.
«Еўрарадыё» пагаварыла са стваральнікам радыё Георгіем Качаноўскім пра тое, навошта яны гэта зрабілі, — і пра тое, калі ШІ заменіць Змітра Лукашука.
“І ў нас атрымаўся паўтарагадзінны эфір з 15 песень”
— Навошта беларусам першае беларускамоўнае ШІ-радыё? Карацей, навошта вы гэта зрабілі?
— Наша галоўная матывацыя — атрымаць досвед працы са штучным інтэлектам на рэальным праекце. Другая матывацыя — падтрымаць беларускую культуру і мову. І зрабіць гэта з мінімальнымі выдаткамі.
Карацей, хацелася злучыць цікаўнасць да сферы штучнага інтэлекту і карысць для людзей. Зрабіць не нейкі праект у стол, а праект для людзей.
Мне хочацца, каб беларуская культура квітнела, каб людзі вучылі беларускую мову. Мы пакуль не ведаем, ці будзе наша радыё для гэтага карысным інструментам, але хочам даведацца.
— Колькі песень у вашым плэйлісце? І ці ў курсе артысты, што іх трэкі прайграюцца на ШІ-радыёстанцыі?
— У курсе. Я сеў і накідаў плэйліст з трэкаў, якія мне падабаюцца. Напісалі аўтарам. Некаторыя адказалі, што так, мы дазваляем, выкарыстоўвайце нашы кампазіцыі. А нехта сказаў — не, лепш не трэба. Такія песні мы замянілі. Але ў цэлым усё адрэагавалі станоўча. І ў нас атрымаўся паўтарагадзінны эфір з 15 песень.
Пакуль гэта некамерцыйны праект. Але калі мы зробімся паўнавартасным радыё, думаю, будзем падключаць сэрвісы накшталт Spotify, які працуе з аўтарамі наўпрост і дае ім адлічэнні ад выкарыстання іх кампазіцый. А мы будзем плаціць гэтаму сэрвісу, бо дамаўляцца з аўтарамі асабіста даволі складана.
Каб скласці эфір, мы паспрабавалі розныя мадэлі штучнага інтэлекту, правяралі, якая з іх лепш працуе з беларускай мовай. Аказалася, што пакуль GPT спраўляецца лепш за ўсё. Мы зрабілі ШІ-вядоўцу, якая ў эфіры расказвае пра папярэднюю песню — і анансуе наступную. Такім чынам мы нібыта звязваем усе песні ў адзін вялікі эфір.
З аналітыкі будзе відаць, ці трэба беларусам ШІ-радыё.
— І што кажа аналітыка?
— Пакуль мы запусцілі праект на лакальным серверы, да нас зайшло 650 унікальных слухачоў. Рэкламы мы не давалі — проста скінулі паслухаць знаёмым, і я ў сябе ў сацсетках апублікаваў анонс.
Сярэдні час праслухоўвання — каля хвіліны. Ну, гэта дастаткова добра. Калі чалавек паслухаў хвіліну, значыць, хутчэй за ўсё, ён пачуў і дыктара, і песню.
Мы сачылі за рэакцыяй тых, каму давалі слухаць. Усім было асабліва цікава даведацца, як гучыць змадэляваны ШІ голас на беларускай мове.
Чыім голасам гаворыць дыджэй?
— Калі я ўключыла радыё ўпершыню, мне здалося, што чую сваю калегу. А чый гэта голас насамрэч?
— Тут была даволі складаная праца. Мы пратэставалі шмат розных мадэляў штучнага інтэлекту, каб знайсці тую, якая нармальна гаворыць па-беларуску. Але калі мы давалі ШІ зачытаць тэкст, кожны раз гаворка была то як у “падвыпілага паляка”, то як у “амерыканскага турыста”. Нармальна на беларускай мове ніводная мадэль не гаварыла.
Але потым мы знайшлі класны праект — Donar. Яны збіраюць галасы, якія размаўляюць на беларускай мове, і трэніруюць на ёй ШІ-мадэль. Вось гэтая мадэль правільна расстаўляе націскі, правільна ўжывае граматычныя формы. Але, на жаль, пакуль яшчэ занадта адчуваецца, што гаворыць робат.
Першую версію радыё мы зрабілі на гэтай мадэлі, але потым вырашылі пашукаць далей. І аказалася, што чат GPT пасля некаторага “цюнінгу” дае добры вынік. Таму пакуль што мы зрабілі дыджэя на аснове GPT, але яшчэ плануем вярнуцца да хлопцаў з donar.by, бо ў іх хутка плануецца абнаўленне — думаю, мадэль загаворыць лепш.
— Дарэчы, а навіны ў вас на радыё будуць ісці?
— Мы хочам зрабіць радыё, якое б дапамагала вывучаць беларускую мову, ад навін вырашылі адмовіцца.
Вось, напрыклад, у мяне ёсць дзве маленькія дочкі, і мы з імі дома размаўляем па-руску. Яны дакладна будуць ведаць яшчэ і польскую, і англійскую мовы. Але мне б хацелася, каб і беларускую ведалі.
Таму я хачу дадаць да нас на радыё вячэрнія казкі для дзяцей на беларускай мове. Мне здаецца, гэта вельмі крута.
Дарэчы, у нас ужо ёсць англамоўная версія радыё. Там тыя ж беларускія песні, але вядоўцы — англамоўныя. Гэтыя ШІ-дыджэі расказваюць па-англійску пра беларускую культуру.
Навошта? Ну, дапусцім, жывеш ты дзе-небудзь у Амерыцы і хочаш амерыканцам расказаць пра Беларусь. Уключаеш радыё — даеш паслухаць.
Робаты адбяруць працу ў журналістаў «Еўрарадыё»?
— То-бок вы плануеце замяніць… нас?
— Ну не. Ваша радыё існуе ўжо даўно, і ў вас вялікая гісторыя, наладжаныя бізнес-працэсы. Паўтарыць вас даволі складана. Але і наша радыё ўнікальнае, бо яшчэ ніхто не рабіў беларускамоўнае радыё праз GPT.
Я не думаю, што мы ствараем вам канкурэнцыю. Гэта, хутчэй, цікавы эксперымент, як можна знізіць выдаткі і даць выбар слухачам.
— Нядаўна адно польскае радыё вырашыла замяніць сваіх журналістаў на ШІ…
— Так, мы ў камандзе пахіхікалі з гэтай навіны. А чым скончылася?
— Слухачы сабралі подпісы супраць такога эксперыменту, і яго згарнулі.
— Ну, гэта цікавая, вядома, навіна. Калі ў наш адрас будзе нейкі негатыў з боку слухачоў, мы таксама спынім распрацоўку. Але цяпер у нас пробны заплыў, эксперымент. Калі мы ўбачым з аналітыкі, што людзям гэта цікава — працягнем. Калі ўбачым, што нецікава — ну, не будзем працягваць.
— А колькі данатаў ўжо сабралі?
— Пакуль кнопка “данат” у нашым інтэрфейсе не вядзе на данаты. Я працую ў сферы стартапаў, і для мяне важна разумець паводзіны карыстальнікаў. Нам трэба разумець, ці ёсць у чалавека жаданне заданаціць. І калі ён націскае на гэтую кнопку — значыць, яно ёсць.
Дарэчы, калі нам заданаціць нельга, можаце размясціць у сябе ў артыкуле спасылку на тых, каму заданаціць можна? У Кракаве ідзе збор на школу, у якой дзеці змогуць навучацца на беларускай мове. Вось іх можна падтрымаць.
А вось кнопка “падзяліцца ідэяй” у нас у сэрвісе працуе. Націскайце і расказвайце, што б вы хацелі пачуць у эфіры.
Мы абяцаем вывучыць усе ідэі і рэалізаваць самыя папулярныя, калі аналітыка пакажа сапраўдную цікавасць беларусаў да гэтай новай тэхналогіі.