Kinijos įmonės ir toliau leidžia dirbtinio intelekto modelius, kurie konkuruoja su OpenAI ir kitų JAV veikiančių AI įmonių sukurtų sistemų galimybėmis.
Šią savaitę „Alibaba“ ir „Tencent“ remiamas startuolis „MiniMax“, pritraukęs apie 850 mln. USD rizikos kapitalo ir vertinamas daugiau nei 2,5 mlrd. USD, pristatė tris naujus modelius: MiniMax-Text-01, MiniMax-VL-01 ir T2A. -01-HD. MiniMax-Text-01 yra tik teksto modelis, o MiniMax-VL-01 gali suprasti ir vaizdus, ir tekstą. Tuo tarpu T2A-01-HD generuoja garsą, ypač kalbą.
MiniMax teigia, kad MiniMax-Text-01, kurio dydis yra 456 milijardai parametrų, veikia geriau nei modeliai, tokie kaip Google neseniai pristatytas Gemini 2.0 Flash pagal tokius etalonus kaip MATH ir SimpleQA, kurie matuoja modelio gebėjimą atsakyti į matematikos problemas ir faktus. pagrįstus klausimus. Parametrai apytiksliai atitinka modelio problemų sprendimo įgūdžius, o modeliai su daugiau parametrų paprastai veikia geriau nei turintys mažiau parametrų.
Kalbant apie MiniMax-VL-01, MiniMax teigia, kad jis konkuruoja su Anthropic's Claude 3.5 Sonnet vertinimais, kuriems reikalingas multimodalinis supratimas, pvz., ChartQA, kuris modeliuoja modelius atsakydamas į su grafiku ir diagramomis susijusias užklausas (pvz., „Kokia yra didžiausia oranžinė linija šioje diagramoje?“). Tiesa, „MiniMax-VL-01“ nėra geriausias „Gemini 2.0 Flash“ daugelyje šių testų. „OpenAI“ GPT-4o ir „Meta's Llama 3.1“ taip pat įveikė keletą.
Pažymėtina, kad MiniMax-Text-01 turi itin didelį konteksto langą. Modelio kontekstas arba konteksto langas nurodo įvestį (pvz., tekstą), į kurią modelis atsižvelgia prieš generuodamas išvestį (papildomą tekstą). Turėdamas 4 milijonų žetonų kontekstinį langą, MiniMax-Text-01 vienu ypu gali išanalizuoti apie 3 milijonus žodžių – arba šiek tiek daugiau nei penkias „Karo ir taikos“ kopijas.
Kalbant apie kontekstą (neskirta žodžių), MiniMax-Text-01 konteksto langas yra maždaug 31 kartą didesnis nei GPT-4o ir Llama 3.1.
Paskutinis iš šią savaitę išleistų MiniMax modelių T2A-01-HD yra kalbai optimizuotas garso generatorius. T2A-01-HD gali generuoti sintetinį balsą su reguliuojamu ritmu, tonu ir tenoru maždaug 17 skirtingų kalbų, įskaitant anglų ir kinų, ir klonuoti balsą iš vos 10 sekundžių garso įrašo.
MiniMax nepaskelbė etaloninių rezultatų, lyginančių T2A-01-HD su kitais garsą generuojančiais modeliais. Tačiau šio reporterio ausiai T2A-01-HD išvestis skamba taip pat, kaip ir „Meta“ garso modeliai ir tokie startuoliai kaip „PlayAI“.
Išskyrus T2A-01-HD, kuris yra išskirtinai pasiekiamas per MiniMax API ir Hailuo AI platformą, naujus MiniMax modelius galima atsisiųsti iš GitHub ir AI dev platformos Hugging Face.
Tačiau tai, kad modeliai yra „atvirai“ prieinami, nereiškia, kad jie nėra užrakinti tam tikrais aspektais. „MiniMax-Text-01“ ir „MiniMax-VL-01“ nėra iš tikrųjų atvirojo kodo ta prasme, kad „MiniMax“ neišleido komponentų (pvz., treniruočių duomenų), reikalingų norint juos atkurti nuo nulio. Be to, jiems taikoma ribojanti „MiniMax“ licencija, kuri draudžia kūrėjams naudoti modelius konkuruojantiems AI modeliams tobulinti ir reikalauja, kad platformos, turinčios daugiau nei 100 milijonų aktyvių naudotojų per mėnesį, prašytų specialios licencijos iš „MiniMax“.
„MiniMax“ 2021 m. įkūrė buvę „SenseTime“, vienos didžiausių Kinijos dirbtinio intelekto įmonių, darbuotojai. Bendrovės projektai apima tokias programas kaip „Talkie“, AI veikianti vaidmenų žaidimo platforma, panaši į „Character AI“, ir teksto į vaizdo įrašus modelius, kuriuos „MiniMax“ išleido Hailuo mieste.
Kai kurie MiniMax gaminiai tapo nedidelių ginčų objektu.
„Talkie“, kuris gruodžio mėn. buvo pašalintas iš „Apple App Store“ dėl nenurodytų „techninių“ priežasčių, yra viešųjų asmenų, įskaitant Donaldą Trumpą, Taylorą Swiftą, Eloną Muską ir LeBroną Jamesą, AI avatarai, iš kurių nė vienas nesutiko būti rodomas programėlę.
Gruodį žurnalas „Broadcast“ pranešė, kad „MiniMax“ vaizdo įrašų generatoriai gali atkurti Didžiosios Britanijos televizijos kanalų logotipus, o tai rodo, kad „MiniMax“ modeliai buvo mokomi tų kanalų turinio. Pranešama, kad „MiniMax“ padavė į teismą Kinijos vaizdo transliacijos paslauga „iQiyi“, kuri teigia, kad „MiniMax“ neteisėtai apmokė „iQiyi“ autorių teisių saugomus įrašus.
Nauji „MiniMax“ modeliai pristatomi praėjus kelioms dienoms po to, kai baigianti Bideno administracija pasiūlė griežtesnes eksporto taisykles ir AI technologijų apribojimus Kinijos įmonėms. Kinijos įmonėms jau buvo neleista pirkti pažangių DI lustų, tačiau jei naujosios taisyklės įsigalios taip, kaip parašyta, įmonės susidurs su griežtesniais puslaidininkių technologijų ir modelių, reikalingų paleisti sudėtingas dirbtinio intelekto sistemas, ribos.
Trečiadienį Bideno administracija paskelbė apie papildomas priemones, kuriomis siekiama, kad sudėtingi lustai nepatektų į Kiniją. Skiedrų liejykloms ir pakavimo įmonėms, norinčioms eksportuoti tam tikrus traškučius, bus taikomi platesni licencijos reikalavimai, nebent jos atliks didesnį patikrinimą ir deramo patikrinimo, kad jų produktai nepasiektų Kinijos klientų.