2025. február 5.

Kína válasza: Nyílt forráskódú kihívás a generatív MI-piacon

Az előző bejegyzésemben az Egyesült Államok mesterséges intelligencia-fejlesztéseiről írtam, és bár forradalmi változásokról beszéltem, a történet itt nem ér véget. Nem sokkal Donald Trump bejelentése után Kína is jelentős lépést tett a generatív mesterséges intelligencia (GenMI) területén, amely új fejezetet nyit az MI-fejlesztések versenyében.

DALL_E
DALL-E
Egy 2023-ban alapított kínai startup nem sokkal Trump bejelentése után bemutatta saját generatív MI-modelljét, a DeepSeeket. A vállalat állítása szerint zászlóshajó modelljük bizonyos jellemzők tekintetében felülmúlja a ChatGPT legfejlettebb verzióját. Ennél is figyelemre méltóbb azonban, hogy a kínai fejlesztők mindezt az amerikai versenytársak költségeinek töredékéből hozták létre. Ráadásul a DeepSeeket nyílt forráskódúvá tették, lehetővé téve más fejlesztők számára, hogy saját vagy továbbfejlesztett alkalmazásokat építsenek rá.

Az amerikai GenMI-fejlesztők gyorsan reagáltak a hírre. Elismerve a DeepSeek teljesítményét, kifogásolták annak rendkívül alacsony költségeit. Különösen azt nehezményezték, hogy a kínai cég az MI betanításához nem saját, hanem ingyenesen hozzáférhető adatkorpuszt használt, és a nagy nyelvi modellek válaszainak felhasználásával ún. desztillációs eljárást alkalmazott. Ez a technika önmagában nem törvényellenes, de az amerikai cégek szerint ebben a méretben már etikai kérdéseket is felvet. Hogy pontosan mi az igazság, még nem tisztázott, de a jövőben várhatóan további részletek is napvilágra kerülnek.

A kínai cég döntése a nyílt hozzáférhetőség mellett különösen figyelemreméltó. Aki olvassa ezt a blogot, tudja, hogy a nyílt tudomány, a nyílt forráskód és a szabad hozzáférés elkötelezett híve vagyok. A tudományos fejlődés egyik leghatékonyabb módja, ha az adatok, módszerek és publikációk minél szélesebb körben elérhetők. Az információ üzleti célú elzárása helyett egy olyan rendszer kialakítása a kívánatos, amelyben a kutatás és fejlesztés mindenki számára hozzáférhető.

Bár a DeepSeek jelentős lépést tett ebbe az irányba, nem az egyetlen ilyen kezdeményezés. Például a YuE, egy népszerű nyílt forráskódú zenegenerátor, szintén szabadon elérhető a

GitHubon. Az ilyen modellek lehetővé teszik a kutatók és fejlesztők számára, hogy biztonságos, helyileg futtatható alkalmazásokat hozzanak létre, csökkentve az adatbiztonsági és magánéleti aggályokat.

DALL_E
DALL-E
Egyelőre az átlagos felhasználók számára a nyílt forráskódú GenMI nem jelent közvetlen előnyt, mivel a modellek futtatásához nagy teljesítményű hardver szükséges. Egy erre optimalizált NVIDIA GPU ára könnyedén elérheti az egymillió forintot, ami komoly akadályt jelent az átlagos felhasználónak. Ugyanakkor egyre több szolgáltatás kínál bérelhető szerverkapacitást, amely lehetővé teszi, hogy a felhasználók hozzáférjenek ezekhez a technológiákhoz anélkül, hogy saját infrastruktúrát kellene fenntartaniuk.

A nyílt forráskód elsősorban kutatócsoportoknak, startupoknak és techcégeknek kedvez. Ezek a szereplők meglévő modellekre építve gyorsabban fejleszthetnek új alkalmazásokat, anélkül hogy az alapoktól kellene újrakezdeniük. Ezenkívül a nyílt modellek segítenek feltérképezni az MI korlátait, lehetőséget biztosítva a módszertani fejlesztésekre és a személyre szabott alkalmazások létrehozására.

A kínai DeepSeek lépése komoly kihívást jelent az amerikai techcégek számára. A költséghatékonyság, a magas teljesítmény és a nyílt hozzáférhetőség kombinációja új dinamikát hoz az MI-fejlesztések versenyébe. A technológiai versengés nem mindig kedvező, de kétségtelen, hogy nagy lökést adhat az innovációnak. Érdemes figyelemmel követni, hogyan reagálnak erre az amerikai cégek, és milyen irányba fejlődik a generatív MI jövője.