Podcasty stały się jedną z najpopularniejszych form konsumpcji treści w ostatnich latach. Słuchamy ich w drodze do pracy, podczas treningu czy w chwilach relaksu. Jednak ich tworzenie, szczególnie na wysokim poziomie jakości, wciąż wymaga czasu i zasobów. ElevenLabs, firma specjalizująca się w technologii Voice AI, wychodzi naprzeciw tym wyzwaniom, wprowadzając innowacyjną funkcję GenFM. To rozwiązanie, dostępne w aplikacji ElevenLabs Reader, pozwala w prosty sposób tworzyć wielojęzyczne podcasty z różnych źródeł treści – od dokumentów po filmy z YouTube. Co więcej, aplikacja wykorzystuje zaawansowane algorytmy, aby nadać nagraniom naturalny charakter, który jeszcze bardziej angażuje odbiorców.
GenFM – jak to działa?
GenFM to funkcja dostępna w aplikacji ElevenLabs Reader na iOS. Pozwala na przesyłanie różnych rodzajów treści, takich jak filmy z YouTube, dokumenty czy teksty, aby w kilku krokach stworzyć podcast z narracją wielogłosową. Obecnie funkcja obsługuje 32 języki, w tym angielski, polski, hiszpański, francuski, niemiecki, japoński i wiele innych.
Po załadowaniu treści aplikacja automatycznie wybiera dwa głosy spośród kilkunastu dostępnych, które odczytają przygotowaną narrację. Co ciekawe, proces generowania audio uwzględnia takie elementy jak przerwy, „uhmy” czy inne ludzkie dźwięki. Jak powiedział Jack McDermott, odpowiedzialny za rozwój mobilny ElevenLabs:
„Debatowaliśmy nad tym, jak bardzo wprowadzać takie elementy jak ‘uhmy’, ‘mhmmy’, śmiech czy oddechy, które imitują naturalne dialogi. Staramy się znaleźć idealną równowagę między naturalnością ludzkiej konwersacji a użytecznością generowanego contentu”.
Dlaczego „umms” i „ahs” są ważne?
W dobie technologii, które eliminują dźwięki wypełniacze, ElevenLabs idzie pod prąd, dodając je do swoich podcastów. Dlaczego? McDermott wyjaśnia, że najciekawsze podcasty cechuje płynność i naturalny charakter rozmów, które bardziej angażują słuchacza. Dzięki temu słuchacze mają wrażenie obcowania z prawdziwymi rozmówcami, a nie sztuczną narracją.
– Zależy nam na tym, aby dostarczać wciągające narracje audio dostępne w różnych językach i głosach – dodaje McDermott.
Rozwój i plany ElevenLabs
Nie tylko GenFM przyciąga uwagę. ElevenLabs rozwija się w szybkim tempie, a jednym z kluczowych kroków jest otwarcie centrum badawczo-rozwojowego w Warszawie. Firma inwestuje 11 milionów dolarów w polski ekosystem startupowy, aby przyciągnąć lokalne talenty AI. Równocześnie firma ekspanduje na rynek indyjski, zatrudniając tam liderów biznesowych i budując zespół.
Kolejnym krokiem ElevenLabs będzie wprowadzenie jeszcze większej personalizacji i możliwości łączenia różnych źródeł treści, aby tworzyć bardziej zaawansowane podcasty generatywne.
Konkurencja z NotebookLM od Google
We wrześniu Google zaprezentowało funkcję generowania rozmów AI z wykorzystaniem źródeł dostarczonych przez użytkowników w NotebookLM. W październiku firma dodała możliwość personalizacji wygenerowanych podcastów. ElevenLabs wchodzi więc na rynek z mocnym konkurentem, oferując dodatkowo obsługę wielu języków i realistyczną symulację rozmów.
Co oznacza GenFM dla twórców treści?
GenFM to idealne rozwiązanie dla twórców treści, którzy chcą szybko i efektywnie tworzyć podcasty. Dzięki wielojęzyczności i prostocie obsługi można dotrzeć do globalnej publiczności, tworząc treści w różnych językach. Dodatkowo, narzędzie to otwiera nowe możliwości dla marketerów, edukatorów i przedsiębiorców, którzy chcą wzbogacić swoje strategie komunikacyjne o angażujące podcasty.
Źródło: ElevenLabs | TechCrunch
Zdjęcie: ElevenLabs GenFM