Suvel kirjutasime, et 2024. aasta jooksul on OpenAI mudelite hinnad vähenenud 200 korda. Nüüd kostitab OpenAI meid järjekordse hinnalangusega.
Kõige pealt laiendas ja optimeeris OpenAI GPT-4 mudelit. Optimeeritud ja laiendatud oskustega mudeli sai nimeks GPT-4o. Täht “o” mudeli nimetuses pidavat tähistama sõna “omni”, mis tähendas, et GPT mudel suutis nüüd vastu võtta pilte ja nendest eraldada olulist teksti.
Piltidest aru saada ja teksti eraldada 4o mudel tõesti suudab, kuid klientidele tehtud projektides tuvastasime, et Azure Computer Vision teenus eraldab teksti palju paremini. Nende kahe teenuse kombineerimisel saime parema tulemuse.
Seejärel tuli tuli OpenAI välja mudeliga GPT-4o mini, mis on veelgi kiirem ja odavam. Arutlemises jääb ta küll täis suurusest mudelitele alla, kuid kokkuvõtete tegemises ja teistes teksti töötlemise ülesannetes on suuremate mudelitega võrdväärne. GPT-4 ja GPT-4o mini hinnavahe ongi u 200 korda.
Mudel, mis oktoobrist odavamaks läheb, on GPT-4o – vahepealse hinnaklassi mudel. Sisendite hind peaks minema odavamaks 50% ja väljundite hind 33%. AI mudelite hinnad 2024. suvel:
Mudel | Hinnastamine |
GPT-4o sisend-tokenid | $5.00 / 1 miljon tokenit |
GPT-4o väljund-tokenid | $15.00 / 1 miljon tokenit |
GPT-4 sisend-tokenid | $30.00 / 1 miljon tokenit |
GPT-4 väljund-tokenid | $60.00 / 1 miljon tokenit |
GPT-4o mini sisend-tokenid | $0,15 / 1 miljon tokenit |
GPT-4o mini väljund-tokenid | $0,60 / 1 miljon tokenit |
OpenAI ei ole veel hinnakirja uuendanud, kuid hinnad võiksid oktoobrist olla midagi sellist:
Mudel | Hinnastamine |
GPT-4o sisend-tokenid | $2.50 / 1 miljon tokenit |
GPT-4o väljund-tokenid | $10.00 / 1 miljon tokenit |
Miks on GPT-4o selline hinnalangus hea uudis?
Enamikus äriprotsessides on GPT-4o mudeli ülesanne arutlemine. Me:
- paneme kokku inimese küsitud küsimuse,
- kogume infosüsteemist kokku hulga erinevaid andmeid – tabelid, dokumendid, kommentaarid, toodete info,
- anname juhised, kuidas infot analüüsida
- anname juhised, milline on meie ootus väljundile
See kõik kokku on hunnik infot, mida OpenAI peab sisse võtma ja analüüsima. Ja analüüsi tulem võib olla lihtsalt “Jah/Ei” või paari lausega kokkuvõte. Sisse läheb kõvasti rohkem andmeid kui välja tuleb.
Tavalistes protsesside on väljund-tokenite maht kordades väiksem kui sisendite maht ja seepärast ongi sisendi kulu vähenemine hea uudis.
Täpsustus 07.10.2024
OpenAI teatas hiljuti, et muudab uute mudelite hinnastamist selliselt, et kui 5-10 minuti jooksul saab tehisintellekt korduvalt samu juhiseid, siis identsete juhiste korral rakendub järgnevale juhisele allahindlus 50%. Paljud äriprotsessis otsustamise põhimõtteid kirjeldavad juhised on päris mahukad ning need eelnevad igale andmehulgale, mille osas on vaja langetada otsuseid. Tehisintellektistsenaariumites, kus on vaja langetada otsuseid tihedalt, võib taoline soodustus tuua olulist säästu.
Lisaks lõi OpenAI nüüd võimaluse kõne otse AI-le suunata ja sealt otse kõnena tagasi saada. See muudab senised töövood, kus kõne oli vaja enne tekstiks muuta, küsida AI-lt vastus ja vastus kõneks teha, sirgjoonelisemaks ja kiiremaks.