DeepSeek este la câteva zile de cea mai importantă lansare AI din ultimul an
Compania chineză DeepSeek urmează să lanseze săptămâna viitoare cel mai nou model de AI al său, la mai bine de un an de când a devenit celebră pe plan mondial.
Fondată în 2023, DeepSeek a lansat gratuit la finalul lui 2024 un model lingvistic de mari dimensiuni (LLM) open-source, numit V3, despre care a afirmat că a fost antrenat cu cipuri mai puțin performante și la doar o fracțiune din costul modelelor dezvoltate de companii precum OpenAI și Google.
Compania chineză plănuiește să prezinte săptămâna viitoare V4, un model „multimodal”, capabil să genereze imagini, video și text, spun două surse citate de Financial Times. Sursele mai spun că DeepSeek a lucrat cu cipuri de la companiile chineze Huawei și Cambricon.
Va fi prima lansare majoră de model AI a DeepSeek din ianuarie 2025 până acum. Atunci, compania a prezentat modelul denumit R1 și susținea că a construit un sistem comparabil cu modelele de top din Silicon Valley, folosind însă doar o fracțiune din puterea de calcul (și din costuri).
Anunțul a provocat o undă de șoc în cotația acțiunilor companiilor americane.
În ultimele 13 luni, DeepSeek a lansat mai multe actualizări de mai mică amploare, și nu un model complet nou. În acest context au câștigat cotă de piață companii locale precum Alibaba și Moonshot AI pe piața modelelor lingviste mari dezvoltate la costuri reduse.
Sursa foto: Dreamstime.com