„Nie chciałbym grać w grę z dubbingiem wygenerowanym w całości przez AI”. Rysław o wykorzystaniu sztucznej inteligencji na przykładzie głosu Piotra Fronczewskiego
Wchodzimy w ere gdzie niektorzy devi uzywaja stron takich jak FakeYou do generowania glosow, brzmi to okropnie ale kogo to.
A co ma powiedzieć skoro to mu zmniejsza zarobki?
Ja wolę grać w grę z pełnym AI dubbingiem niż grą która w ogóle dubbingu nie ma, i co?
Jasne że fajniej żywy, ale nie każdego stać na taki.
Rzeczywiście krucho będzie z nimi jak AI będzie potrafiło lepiej naśladować emocje niż przeciętny dubbingowiec .. a GPT 4 o zbliżyło się już niebezpiecznei blisko.
Rok temu jeszcze byśmy o tym nie myśleli że AI może emocje fakować w głosie, teraz może. Za rok co będzie? :>
Trzeba inteligencji świerszcza zeby stwierdzic, ze:
Kradziez jest ok bo osoby ktore protestuja to te okradane, a skoro okradany protestuje w wlasnym interesie to jego zdanie sie nie liczy...
Pierwsza czesc to bzdurna manipulacja prezentujaca zwykle stwierdzenie faktu niczym odkrycie jakiegos spisku, druga to wyciagniecie z du* widzimisie udajace dogmat (i nie pije akurat do postu
Ps. Jesli ktorekolwiek z zacytowanych "argumentow" wydawal ci sie sensowny - sugeruje zrewidowac swoja opinie na temat "kazań" ktore odrzuciles bo "bezzasadnie" sugerowaly, ze miejsce/przyszlosc ludzi takich jak ty jest w piekle...
Rok temu jeszcze byśmy o tym nie myśleli że AI może emocje fakować w głosie, teraz może. Za rok co będzie? :>
Problemem nie jest AI tylko lamanie juz nawet obecnie istniejacego conajmniej nieadekwatnego prawa (licencji) - nieadekwatnego z racji jego ustanawionia jescze przed powstaniem AI - nie mowiac juz o koniecznosci wprowadzenia nowego bo prawo musi regulowac AI, z tej racji ze obecnie juz reguluje, ale tylko nas. (nie wierzysz? chetnie sie poscigam z Chatem GPT w wyciaganiu kart graficznych z serwerow datacenter...)
Poniewaz jesli mozesz lamac jedno prawo to nic nie stoi na przeszkodzie zeby lamac pozostale i jesli myslisz ze jestes ponadto to sie zastanow dlaczego wogole ktokolwiek mialby pracownikom takim jak ty wogole placic? (np. z racji mozliwosci blokowania sadu prawnymi sztuczkami w wykonaniu AI). Albo dlaczego twoj dom nie mial by trafic w "lepsze rece" (narastajacy problem w niektorych miejscach USA, australii i wielkiej brytani gdzie juz mozna stracic dom bo ktos ci sie do niego wlamal lub pomazal sprayem...)
Pamietaj, w slynnym cytacie: "TY nie bedziesz mial nic" jest czescia gwarantowana, ale "i bedziesz szczesliwy" nie jest nawet na etapie planowania, bo niby i z jakiej racji...
CO!? Ale jaka kradzież!?
ja nie mówię o naśladowaniu głosu kogoś, bo to tak, jest kradzież. Ale generowaniu nowego głosu, gdzie widzisz w tym kradzież? o0
Mi chodzi o to, że protestuje bo on uprawia pole ręcznie, a sąsiad kupił kombajn i robi szybciej, więcej i taniej i jeszcze więcej zarabia.. Nikt nie mówi że teraz sąsiad ma okradać mu pole..
ale żeś pojechał XD
"(narastajacy problem w niektorych miejscach USA, australii i wielkiej brytani gdzie juz mozna stracic dom bo ktos ci sie do niego wlamal lub pomazal sprayem...)"
największy rak którego niecierpie, a Ty mi mówisz że ja niby jestem za tym? XD
Generowanie nowego głosu vs wchodzenie butami do CZYJEGOŚ mieszkania. Gdzie, co jak kiedy!?
Korzystam z AI na codzień jako developer, wrzucam stacktrace, daje kontekst, albo nawet głupie snippety, boom , 50% że mu się uda mi pomóc. Rok temu to było może 10%. Więc zakładam że za 1 rok będę miał robotę juniorską zrobioną. Ja, jako lead się nie boję, bo jeszcze kilka latek mam, ale juniorzy to raczej będą mieli ciężko.. cóż. takie życie. Taksówkarze na Ubera też narzekali, poczta polska na paczkomaty, koleje i statki na samoloty, sieci telefonowe na internet, posłaniec na pomysł poczty polskiej.. wszystko ma swój kres ;) nawet seks nam się znudzi, patrz projekt "Voxta", VR, zabawki oskryptwane..
Pamietaj, w slynnym cytacie: "TY nie bedziesz mial nic" jest czescia gwarantowana, ale "i bedziesz szczesliwy" nie jest nawet na etapie planowania, bo niby i z jakiej racji...
^-- generalnie się zgadzam, bo po co nam "coś" jak dadzą szczęście? Nie wiem czemu uważasz że mielibyśmy nie być szczęśliwi? Szczęście to ciekawa rzecz, każdy ma inny jego poziom bazowy, w zależności od sytuacji życiowej i dla jednego szczęście to zwykły spacer i rozmowa, a dla drugiego zarobienie 5000% normy, gdzie norma to 50k miesięcznie netto. Albo i wyżęj. Oboje są szczęśliwi, fajnie to opisuje Harari. Więc uważam że jakby dano nam sztuczne szcżęście ale działające na nasz mózg - to będziemy szczęśliwi. Nawet nic nie mająć poza tym stymulantem. Pytanie, czy to wystarczy? Może.. w końcu ludzie chcą być szczęśliwi, jak są, to nie uciekają z tego świata. Jeśli ktoś wymyśli jak oszukać poczucie szczęścia u ludzi, to będzie ciekawe bardzo. Socjale były blisko ale.. nie dokońca tam. Raz, nie dla każdego to jest szczęście, a dla których jest - a są tacy - to jak tylko odłożą social to się dołują, i to jest drugie ostrze. Jak ktoś zbuduje aplikacje szczęścia bez drugiego ostrza, to wygra nas wszystkich pewno
CO!? Ale jaka kradzież!?
ja nie mówię o naśladowaniu głosu kogoś, bo to tak, jest kradzież. Ale generowaniu nowego głosu, gdzie widzisz w tym kradzież? o0
Mi chodzi o to, że protestuje bo on uprawia pole ręcznie, a sąsiad kupił kombajn i robi szybciej, więcej i taniej i jeszcze więcej zarabia.. Nikt nie mówi że teraz sąsiad ma okradać mu pole..
ale żeś pojechał XD
Po pierwsze: pomijajac "nasladowanie glosu" wspomniane przez ciebie, dochodzi tez warsztat aktorski (praca) i sam charakter odgrywanej postaci - cwaniakujesz przedstawiajac uproszczany i obciety (ztrywializowany) opis rzeczywistosci, w oczywistym celu manipulacyjnego zanizenie wartosci "kradzionego towaru"... Juz nie tylko lepkoreka mentalnosc - tu mowimy o praktyce!
Po drugie: odnosnie kradziezy - AI uczy sie przez ladowanie w nie absurdalnych ilosci informacji. Powiedz nam, o wielki medrcze, skad wlasciciel AI mial te absurdalne ilosci wysokiej jakosci materialow prezentujacych nie tylko glos ale tez czesto warsztat aktorski? (bo przeciez w automatycznym dubbingu nie chodzi o to zeby AI serwowalo nam amatorszczyzne reprezentowana np. przez przypadkowych ludzi z ulicy - ktorzy tez przeciez maja prawo do prywatnosci)
Po trzecie, ad Korzystam z AI na codzień jako developer, wrzucam stacktrace, daje kontekst, albo pomijajac juz z tego co kojarze slaby wzrost wydajnosci, gorszej jakosci prace, AI zostajace w tyle za trendami nie mowiac superÓczciwy sposob w jaki kod do trenowania znalazl sie w lapkach mikrosoftu -- powiem tak, ludzie odnoszacy profit z watpliwej moralnie dzialalnosci extremalnie rzadko sa objektywnym sedzia, zwlaszcza kiedy idzie o ocenianie owej dzialalnosci...
Ps. Jesli idzie o AI generalnie, do czego sie podejrzewam sprowadzi na dluzsa mete, to niewielki wzrost wydajnosci na wiekszosci stanowisk, polaczony z zajezdzaniem 12+/7 wystraszonych AI ludzi - uzasadniane mitycznymi zyskami wydajnosci zwiazanymi z AI (gdzie te mityczne zyski beda w duzej czesci braly sie z zapier* wlasnie...)
Jesli jestes developerem i bylys nim wystarczajaca dlugo - to pewnie kojarzysz korpo-twory o takim wlasnie dzialaniu.
"Po drugie: odnosnie kradziezy - AI uczy sie przez ladowanie w nie absurdalnych ilosci informacji. Powiedz nam, o wielki medrcze, skad wlasciciel AI mial te absurdalne ilosci wysokiej jakosci materialow prezentujacych nie tylko glos ale tez czesto warsztat aktorski? (bo przeciez w automatycznym dubbingu nie chodzi o to zeby AI serwowalo nam amatorszczyzne reprezentowana np. przez przypadkowych ludzi z ulicy - ktorzy tez przeciez maja prawo do prywatnosci)"
"Jesli idzie o AI generalnie, do czego sie podejrzewam sprowadzi na dluzsa mete, to niewielki wzrost wydajnosci na wiekszosci stanowisk"
Ah trzeba było mówić żeś z gildii "przyszłośc jest zła' czy coś.
Wiesz że ludzie też słuchają innych i też ich naśladują? Inspirują się? Tworzą piosenki na bazie innych, tworzą filmy na bazie innych, ba! Tworzą gry na bazie innych. Inspiracja !== kradzież. Nigdy tym nie była w chyba żadnym prawie. Jak AI miałoby się nauczyć tych rzeczy bez słuchania tych rzeczy? Jak dziecko miałoby się nauczyć mówić nie słuchając innych? AI działa trochę jak człowiek.. my też jesteśmy naładowani tymi informacjami, czemu osoba z uszami, oczami nie kradnie, a AI kradnie? (to ostatnie troche mnie przeraża ;p bo ogólnie czasem mam wyobrażenia o AI, że zlikwiduje mi moją pracę a może za 20 lat zobaczymy scenariusz niczym z ME i Gethami, z Nier czy Stellar Blade, albo inne post apo gdzie AI przerosło rasę która je stworzyła. A czasem mam wrażenie że to bzdura, nie jestm tutja pewny. Ale wiem że to jest potężne narzędzie do pomocy, i mam nadzieje że narzędziem pozostanie. Więc usprawiedliwianie AI z mojej strony brzmi troche durnie :P ale na poważnie mówiąc, na ten moment, nie widzę powodu żeby jasno powiedzieć że AI nie może, a my możemy)
Spoko no :D skoro uważasz lepiej ile mi daje AI w pracy. z AI trzeba umieć korzystać, tzn ja nie wiem czy umiem korzystać dobrze, ale wiem że nie można kopiować na ślepo co wypluje.
https://www.youtube.com/watch?v=V6pYxfcDRks
Nie chce wyjść na zarozumiałego, ale coś mi się wydaje, że przypadku dubbingu AI jak i w ogóle tłumaczeń AI wasz ekspert mocno się myli.
Sugerowałbym mocno zainteresować się tematem bo może się okazać, że wkrótce jakiś startup wejdzie na rynek z dubbingiem AI i wykosi go z rynku bo dla Rysława zrobienie dubbingu będzie za drogie a startup ogarnie za ułamek kwoty z pomocą AI :)
Cóż, jedni się dostosują i zaczną korzystać z AI, aby się wspomóc, a pozostali będą twardo stać przy swoim i oczekiwać na wyjątkowe propozycje, próbując tłumaczyć wysoką cenę swoją jakością usług. Rynek szybko zweryfikuje, którzy z nich więcej na tym "ugrają".
"Rysław słusznie zwraca uwagę, że żywemu aktorowi można bez problemu wytłumaczyć, które słowa ma inaczej zaintonować, które mają być wypowiedziane ciszej, a które głośniej. W przypadku sztucznej inteligencji nie jest to takie łatwe."
IMO: pitolenie. Rozwój AI przyspieszył przez ostatnie 2 lata w stopniu podwójnie wykładniczym, czyli w uj jest szybki.
Już dziś GPT-4o, może sobie poradzić z tym problemem, a z roku na rok będzie to rozwijane tak mocno, że za kilkanaście miesięcy najlepsi aktorzy głosowi mogą być jak amatorzy ze szkolnego kółka teatralnego, przy takiej AI. ;)
Próbka GPT-4o: https://youtu.be/wfAYBdaGVxs
Chyba masz bardzo małe wymagania, bo przedstawiony dialog jest okropnie sztuczny, ma złą intonację, a do tego śmiech nie współgra z treścią. Takie coś może zrobić szwagierka za kilka piw, a nie porządne studio dubbingowe.
"Chyba masz bardzo małe wymagania, bo przedstawiony dialog jest okropnie sztuczny, ma złą intonację, a do tego śmiech nie współgra z treścią. Takie coś może zrobić szwagierka za kilka piw, a nie porządne studio dubbingowe."
1. w którym momencie śmiech nie współgra z treścią?
2. to nie był przygotowany przez scenarzystę, z dokładnym opisem sytuacji, tekst do dubingu, ale luźna rozmowa, i jak najbardziej pasuje tutaj - szwagierka.
3. to nie jest końcowy produkt, ale początek drogi AI, która będzie w stanie zastąpić aktorów głosowych, zatem do ideału jeszcze jej brakuje. Ale jak pisałem, możliwe, że już za kilkanaście miesięcy będzie dobrze. Ale jak większość ludzi nie rozumiesz, że co jest dziś, będzie inne jutro, i widzisz tylko krótkowzrocznie - dziś.
Pokazać tylko takim sceptykom jak wyglądały obrazy, czy nawet jakieś krótkie filmy wygenerowane przez AI, a jak wyglądają teraz. No ale nie, skoro teraz nie jest jeszcze idealnie, to nie będzie idealnie już nigdy :D
Weźcie już dajcie z tym Rasławem spokój, bo delikatnie mówiąc pitoli i kompletnie nie zdaje sobie sprawy co może AI i jak szybko się rozwija. To, że ktoś ma jakieś doświadczenie w dabingowaniu gier, nie znaczy, że od razu jest ekspertem od innych technologi, które są z tym powiązane. To jakby konstruktor parowozów wypowiadał się, że samochody do niczego się nie nadają i w przyszłości nadal będziemy parowozami jeździli. Ma idealny przykład z Cp2077, który nawet jeest w tekście, gdzie jedna postać jest wygenerowana sztucnie tzn. dialogii tej osoby. I co? I nic. Nikt się nawet nie skapnął.
To jak działa AI, zależy tylko i wyłącznie od osoby, która decyduje co chce takim AI robić. Koleś wypowiada się, że aktorowi można coś tam powiedzieć, by inaczej zaakcentował dane słowo itp. Dokładnie to samo można zrobić z AI. Wystarczy takie parametry zaprojektować. Można takie rzeczy rozbić na wiele czynników.
Przykład produktów od Stable Diffusion. Oni w swoich algorytmach od samego początku zakłada masę parametrów, którymi użytkownik będzie mógł sterować. Po odpalenie programu mamy masę przełączników, suwaków i parametrów do ustawiania. Pracują też na Voice AI.
Gada jakieś dyrdymały o prawie. Nikt przecież nie będzie chciał w ten sposób dabingować gier, by robić to z wykorzystaniem znanych osób bez ich zgody.
W grach nie ma to takiego znaczenia czy ktoś podkłada głos jest znaną postacią czy nie. Jest to jedna z metod promowania produkcji jak np. CP2077 z Kenu, ale właśnie tu jest ogromna okazja dla takich aktorów głosowych.
W przyszłości czynnik ludzki będzie na wagę złota, więc ci bardzo znani będą rozchwytywani. Oberwie się jedynie tym małym, miernym czy słabym aktorom.
Tak jak już się oberwała wielu mniejszym zespołom przez AI. Suno i inne tego typu algorytmy odebrały zarobek takim małym i mało znanym zespołom.
Niech ten człowiek wyjdzie ze swojej jaskini i zobaczy jak AI robiące obrazy, muzykę, filmy, voice acting, odgłosy świata czy nawet CGI rozwinęły się w ciągu ostatnich 6 miesięcy. Wczoraj śmialiśmy się ze Willa Smitha jedzącego spaghetti wygenerowanego przez Stable Diffusion, a dziś mamy Sorę, która potrafi stworzyć fotorealistyczny fragment filmu. W Japonii wyprodukowano pierwszy serial anime za pomocą AI. Zrobiono wszystko za pomocą AI. Od grafiki, po dialogi, odgłosy itd. Jedynie montaż był przez człowieka robiony. Ale to było dawno, bo w zeszłym roku. Dziś nawet montażu nie musieliby robić.
On zajmuje się tłumaczeniem gier, a tego AI nie jest i podejrzewam, że jeszcze bardzo długo nie będzie w stanie zrobić z zachowaniem sensu oryginalnej wypowiedzi w tym nieprzetłumaczalnych, charakterystycznych dla danego języka określeń, idiomów czy nawiązań popkulturowych, gdzie trzeba po prostu szukać odpowiedniego zamiennika z języka polskiego.
Np. jest taki idiom angielski "Barking up the wrong tree", który nawet rzekomo najlepszy translator na świecie DeepAI tłumaczy jako szczekanie na niewłaściwe drzewo. Natomiast właściwym znaczeniowo dla niego polskim odpowiednikiem jest "Być w błędzie"
Nie pamiętam co to dokładnie był za przykład, ale właśnie o to chodziło, że sens zdania był inny niż dosłowne tłumaczenie. Tłumacz od googla tłumaczył dosłownie, a ChatGPT zachowując sens zdania. Robił to z rok temu.
Edit: Z ciekawości zapytałem Chat GPT w tej darmowej wersji. nawet on sobie poradził. Wystarczy tylko dać mu wytyczne, by na takie rzeczy zwracał uwagę.
Jestem za aby AI przyśpieszyło pewnie techniczne procesy w tworzeniu gier (np optymalizację) jednak nie powinno tworzyć stylu graficznego, scenariusza, dialogów, tekstów, nie powinno także generować głosów innych niż otoczenie. Jednym słowem nie powinno wykonywać prac artystyczno-kreatywnych.
Jestem też absolutną przeciwniczką wskrzeszania aktorów, by grali we współczesnych produkcjach. Jedynie aktor powinien mieć możliwość wyrażenia zgody na dokończenie produkcji w przypadku śmierci w trakcie kręcenia.
Sztuka powinna pozostać domeną ludzi.
Dlaczego sztuka powinna zostać domeną ludzi? Nikt nie wie czym jest sztuka. Jest to coś, czego nie da się w żadną miarą opisać, sklasyfikować , to czemu miałaby być tylko domeną ludzi?
Wielu ludzi od wieków i to wybitnych próbowało sklasyfikować, stworzyć opis tego czegoś, czym jest sztuka i tak zawsze znajdowały się jakieś wyjątki.
A po co nam Piotr Fronczewski? Ja to widzę tak, że najlepiej by było zrobić oryginalny angielski dubbing tradycyjnie, a potem na podstawie tych nagrań AI generuje różne wersje językowe z oryginalnymi aktorami co jest najbliższe zamysłowi twórców. Uszami wyobraźni słyszę tego Keanu Reevesa, przeklinającego po polsku w Cyberpunku :)
Do ogarnięcia bez problemu. To materiał sprzed 6 miesięcy, a tyle w AI to wieczność.
https://www.youtube.com/watch?v=kBctUymP8r4
Zacdrogo im? Tyle razy się mowi, że lektor to znacznie lepsza inwetycja niż dubbing. O finnsach i klimacie nie wspominajac
Do Dragons Dogmy 2 wyszedł chwilę po premierze mod tłumaczący wszystko w grze na język polski przez AI. Gość zrobił to chyba w dwa dni i moim zdaniem już dawało to radę. Teraz taka firma musi zapłacić jedynie za poprawki a 90% roboty odwali AI.
No co mam powiedzieć jeśli wybierze mu to pracę wiadomo że będzie przeciwny.
Jednak z mojej strony jest to super rozwiązanie na które czekam z niecierpliwością. Chociażby na przykładzie cyberpunka miałem dylemat, bo z jednej strony chciałem, aby Johnny miał głos Keanu Reevesa ale jednak w tak obszerne produkcje z olbrzymią historią, gra się lepiej, jeśli jest w twoim rodzimym jezyku.
Do do tego często dubbingi są robione przez tych samych aktorów i w 10 grach pod rząd słychać ten sam głos...
Nie wspomnę już że sztuczna inteligencja pozwoli na generowanie przygód odpowiedzi haseł nawet pogawędek z npecami. Koniec z jedną linią fabularną albo Max z trzema czy czterema nieograniczona ilość i możliwość kreowania przygody to nam da taki dubbing ai.
A jeśli chodzi o samych autorów to też powinni się cieszyć bo w takim przypadku mogą na przykład dostawać procent od sprzedaży a nie stałą sumę. Umowy też można zmodyfikować na przykład nagrać raz dany głos i potem go tylko odsprzedawać. Żyć nie umierać raz wykona pracę do końca życia będzie miał z tego tantiemy!!! Dlaczego ludzie zawsze widzą same problemy jak wchodzi coś nowego zamiast pomyśleć, ruszyć głową i iść do przodu!
„Nie chciałbym grać w grę z dubbingiem wygenerowanym w całości przez AI”.
A ja bym chciał zagrać w takie GTA lub RDR2 z polskim dubbingiem. Tam jest tyle kwestii mówionych że jak nie znamy dobrze angielskiego to odbiera to radość z gry. Zamiast skupić się na grze to trzeba czytać tekst który często bardzo szybko się pojawia i znika. RDR2 porzuciłem bo już miałem dość tego czytania. Szczęściarze to jedynie ci co znają super angielski wtedy żadne AI im nie straszne bo 99% gier wychodzi po angielsku.
Ja tylko to wrzucę. Naprawdę pozostało nie wiele czasu dla aktorów dubbingowych
https://youtu.be/HeQk3KuBItI?si=bBSrqWKMSAxCfMKx