Ta wersja GTA: San Andreas miała zachwycić, a wygląda jak koszmar. Na prawdziwą rewolucję AI jeszcze trochę poczekamy
Niektórzy wieszczą, że generatywna AI zrewolucjonizuje wkrótce sposób wyświetlania grafiki w grach. Przeróbka GTA: San Andreas pokazuje, że od tego momentu dzieli nas jeszcze dużo czasu.
Generatywna sztuczna inteligencja jest obecnie najgorętszym tematem technologicznym. Nic więc dziwnego, że coraz częściej eksperymentują z nią firmy z branży gier.
Jednym z pomysłów jest generowanie całej grafiki za pomocą modeli AI. Nie wychodzi to najlepiej, bo nie symulują one wirtualnego świata – nie są w stanie utrzymać spójnego obrazu i wszystko zbyt szybko się rozpada. Alternatywnym sposobem, który ostatnio proponuje wielu entuzjastów generatywnej sztucznej inteligencji, jest uruchamianie gry, która miałaby bardzo prostą grafikę, a następnie podrasowywanie na żywo tego obrazu przez AI do wysokich detali.
GTA: San Andreas jak z koszmaru
Najnowszy przykład tego, jak mogłoby to wyglądać, został opublikowany na kanale YouTube Niccyan i wykorzystuje Grand Thef Auto: San Andreas.
Jeśli autor chciał, aby materiał ten zwiększył entuzjazm graczy do generatywnego AI, to raczej odniósł skutek odwroty od zamierzonego.
- Wykorzystany model Runway Gen-3 nie jest w stanie utrzymać spójności nawet przez kilka sekund.
- Co chwila zmienia detale tła i postaci.
- Bohater GTA:SA, czyli CJ, na każdym ujęciu ma inną twarz, a w kilku nawet zmienia się kolor jego skóry.
Do tego należy dodać, że nawet te paskudne obrazy nie są generowane w czasie rzeczywistym.
Oczywiście generatywne AI cały czas jest ulepszane, ale fundamentalne aspekty tej technologii sprawiają, że nieprędko będzie ona w stanie zastąpić tradycyjne silniki graficzne. Halucynacje są czymś, czego nie da się w pełni wyeliminować, bo te modele tak naprawdę nie rozumieją, co generują, ani nie trzymają w pamięci modeli całego wirtualnego świata. Do tego nawet gdybyśmy wyeliminowali te defekty, to taka technologia nie pozwoli na wykreowanie dokładnie takiego stylu artystycznego, jaki wymyślą sobie deweloperzy.
Generatywna AI w grach, ale od innej strony
Widać to było w innym niedawnym przykładzie, w postaci projektu GameGen firmy Tencent, którego model wytrenowano na materiałach z gier z otwartym światem (oczywiście bez zgody ich autorów). Nie tylko wyglądał paskudnie z licznymi halucynacjami, ale potem jego oficjalną stronę szybko skasowano. Nic dziwnego, gdyż był to bardziej pokaz w stylu „jacy to jesteśmy zawansowani i wykorzystujemy AI”, niż coś, w co faktycznie można byłoby grać. Generowane obrazy raczej szkodziły wizerunkowi chińskiego giganta, niż mu pomagały.
Sposobem na obejście podobnych problemów jest natomiast niedawny eksperyment członków grupy Google Research, w którym AI generowało grywalną wersję Dooma, bez żadnego innego silnika. To jednak była raczej fajna sztuczka niż coś, co można by użyć w grach. Model wytrenowano bowiem na samej grze.
Tym samym nawet gdybyśmy chcieli wykorzystać taką metodę, to i tak wpierw musielibyśmy stworzyć całą grę, a potem poświęcić masę czasu i pieniędzy na wytrenowanie na niej modelu. Do tego nawet przy takim materiale do trenowania, ten Doom w wydaniu AI i tak często halucynował. W rezultacie opracowanie takiej gry byłoby znacznie droższe, wymagałoby mocniejszego sprzętu, a na koniec uzyskana jakość i tak byłaby niższa.
Nie znaczy to, że generatywna AI nie ma zastosowania w grach. Niedawno Revolution Software pochwaliło się, że wykorzystało taką technologię do przyspieszenia tworzenia animacji w Broken Sword: Shadow of the Templars – Reforged. Natomiast wizja całej grafiki generowanej w czasie rzeczywistym przez AI nie jest czymś, co szybko ma szanse stać się standardem w branży gier.
Zresztą nawet pomysł urealistycznienia grafiki da się zrealizować w znacznie lepszy wizualnie sposób. Kilka lat temu głośno było o metodzie uczynienia GTA 5 fotorealistycznym, poprzez modyfikowanie na żywo grafiki przy wykorzystaniu bogatej bazy danych obrazów ulic miast. Ten sposób wymagał jednak masy pracy, a nie jedynie wpuszczenia obrazu do gotowego modelu AI, więc nic dziwnego, że nie budzi entuzjazmu osób, które od sztucznej inteligencji wymagają natychmiastowych efektów, bez większych kosztów.