Ketvirtadienį OpenAI išleido 200 USD per mėnesį kainuojantį pokalbių robotą, o AI bendruomenė nežinojo, ką su juo daryti.
Naujasis bendrovės „ChatGPT Pro“ planas suteikia prieigą prie „o1 pro režimo“, kuris, kaip teigia OpenAI, „naudoja daugiau skaičiavimų, kad gautų geriausius atsakymus į sunkiausius klausimus“. Patobulinta OpenAI o1 samprotavimo modelio versija, o1 pro režimas turėtų „patikimiau“ ir „išsamiau“ atsakyti į klausimus, susijusius su mokslu, matematika ir kodavimu, – teigia OpenAI.
Beveik iš karto žmonės pradėjo prašyti nupiešti vienaragius:
Paprašiau ChatGPT o1 Pro Mode sukurti vienaragio SVG.
(Tai modelis, prie kurio galite naudotis už 200 USD per mėnesį) pic.twitter.com/h9HwY3aYwU
– Rammy (@rammydev) 2024 m. gruodžio 5 d
Ir sukurkite „krabų“ kompiuterį:
Pagaliau pritaikome o1-pro į galutinį naudojimo atvejį. pic.twitter.com/nX4JAjx71m
– Ethanas Mollickas (@emollick) 2024 m. gruodžio 6 d
Ir vaškinė poetika apie gyvenimo prasmę:
Aš ką tik užsiprenumeravau OpenAI 200 USD per mėnesį prenumeratą.
Atsakykite į klausimus ir aš juos pakartosiu šioje temoje. pic.twitter.com/oTQxbPxnoP– Garrett Scott 🕳 (@thegarrettscott) 2024 m. gruodžio 5 d
Tačiau daugelis X naudotojų nebuvo įsitikinę, kad o1 pro režimo atsakymai buvo 200 USD.
„Ar „OpenAI“ pasidalino konkrečiais raginimų, kurie nepavyksta naudojant įprastą o1, bet sėkmingai naudojant o1-pro, pavyzdžiais? – paklausė britų kompiuterių mokslininkas Simonas Willisonas. „Noriu pamatyti vieną konkretų pavyzdį, rodantį jo pranašumą.
Tai pagrįstas klausimas; juk tai brangiausia pasaulyje pokalbių roboto prenumerata. Ši paslauga teikiama su kitais privalumais, pvz., panaikinami tarifų apribojimai ir neribota prieiga prie kitų OpenAI modelių. Tačiau 2 400 USD per metus nėra didelis pokytis, o o1 pro režimo vertės pasiūlymas išlieka miglotas.
Nereikėjo ilgai surasti nesėkmių atvejų. O1 profesionalus režimas kovoja su Sudoku, o jį suveikia optinės iliuzijos pokštas, kuris yra akivaizdus bet kuriam žmogui.
o1 ir o1-pro nepavyko, tikriausiai dėl regėjimo apribojimų (tas pats su Sudoku galvosūkiais) https://t.co/mAVK7WxBrq pic.twitter.com/O9boSv7ZGt
– Tiboras Blaho (@btibor91) 2024 m. gruodžio 5 d
„OpenAI“ vidiniai etalonai rodo, kad „o1 Pro“ režimas veikia tik šiek tiek geriau nei standartinis o1 kodavimo ir matematikos uždaviniuose:
„OpenAI“ atliko „griežtesnį“ tų pačių etalonų vertinimą, kad parodytų o1 pro režimo nuoseklumą: modelis buvo laikomas išsprendusiu klausimą tik tuo atveju, jei keturis kartus iš keturių gavo teisingą atsakymą. Tačiau net ir atliekant šiuos bandymus patobulinimai nebuvo dramatiški:
OpenAI generalinis direktorius Samas Altmanas, kuris kažkada rašė, kad OpenAI buvo a kelias „Susiekiant į intelektą per pigu, kad būtų galima išmatuoti“, ketvirtadienį buvo priverstas kelis kartus paaiškinti, kad „ChatGPT Pro“ netinka daugumai žmonių.
„Dauguma vartotojų bus labai patenkinti o1 („ChatGPT) Plus“ pakopoje! jis pasakė per X. „Beveik visiems bus geriausiai naudinga mūsų nemokama arba pliusinė pakopa.
Taigi kam jis skirtas? Ar tikrai yra žmonių, norinčių mokėti 200 USD per mėnesį, kad užduotų žaislinius klausimus, pvz., „Parašykite 3 pastraipų esė apie braškes nenaudodami raidės e“ arba „išspręskite šią matematikos olimpiados problemą“? Ar jie laimingai išsiskirs su sunkiai uždirbtais pinigais negarantuodami, kad standartinis o1 negalės patenkinamai atsakyti į tuos pačius klausimus?
Aš paklausiau Ameet Talwalkar, mašininio mokymosi docento Carnegie Mellon ir „Amplify Partners“ rizikos partneris – jo nuomonė. „Man atrodo didelė rizika pakelti kainą dešimt kartų“, – elektroniniu paštu „TechCrunch“ sakė jis. „Manau, kad po kelių savaičių turėsime daug geresnį potraukį šiai funkcijai.
UCLA kompiuterių mokslininkas Guy Van den Broeckas vertindamas buvo atviresnis. „Nežinau, ar kainos taškas yra prasmingas“, – sakė jis „TechCrunch“, – ir ar brangūs samprotavimo modeliai bus norma.
o1 yra „geresnis už daugelį žmonių atliekant daugumą užduočių“, nes, taip, žmonės egzistuoja tik amnezinėse bekūniškose pokalbių sąsajose https://t.co/zbLY2BG5pQ
— Aidanas McLau (@aidan_mclau) 2024 m. gruodžio 6 d
Dosniai manoma, kad tai rinkodaros klaida. „O1 Pro“ režimo apibūdinimas kaip geriausiai sprendžiantis „sunkiausias problemas“ potencialiems klientams nelabai ką pasako. Taip pat nėra miglotų teiginių apie tai, kaip modelis gali „mąstyti ilgiau“ ir demonstruoti „protingumą“. Kaip pažymi Willisonas, be konkrečių šios tariamai patobulintos galimybės pavyzdžių sunku iš viso pateisinti mokėti daugiau, jau nekalbant apie dešimt kartų didesnę kainą.
Kiek galiu pasakyti, tikslinė auditorija yra specializuotų sričių ekspertai. „OpenAI“ teigia, kad ketina suteikti saujelei medicinos tyrėjų „pirmaujančiose institucijose“ nemokamą prieigą prie „ChatGPT Pro“, kuri apims o1 pro režimą. Klaidos yra labai svarbios sveikatos priežiūros srityje, ir, kaip Bobas McGrew, buvęs OpenAI vyriausiasis tyrimų pareigūnas, pažymėjo X, geresnis patikimumas galbūt yra pagrindinis o1 pro režimo atrakinimas.
Kurį laiką žaidžiau su o1 ir o1-pro.
Jie labai geri ir šiek tiek keisti. Jie taip pat dažniausiai nėra skirti daugumai žmonių. Jums tikrai reikia išspręsti sudėtingas problemas, kad gautumėte naudos. Bet jei turite tokių problemų, tai labai didelis dalykas.
– Ethanas Mollickas (@emollick) 2024 m. gruodžio 5 d
McGrew taip pat svarstė, kad „o1 Pro“ režimas yra pavyzdys to, ką jis vadina „žvalgybos viršūne“: vartotojai (o galbūt modelio kūrėjai) nežino, kaip gauti naudos iš bet kokio „papildomo intelekto“ dėl esminių paprastos, tekstinės sąsajos ribų. . Kaip ir su kitais OpenAI modeliais, vienintelis būdas bendrauti su o1 pro režimu yra per ChatGPT, ir, McGrew nuomone, ChatGPT nėra tobulas.
Tačiau tiesa, kad 200 USD kelia didelius lūkesčius. Sprendžiant iš ankstyvo priėmimo socialinėje žiniasklaidoje, „ChatGPT Pro“ nėra „slam dunk“.