OpenAI on viimasel ajal oma mudeleid kõvasti optimeerinud ning tegi avalikuks mitu uut mudelit. Uued mudelid ka soodsamad kui selles postituses näidetena toodud mudelid. Uued mudelid ei ole ka 1:1 varasemate mudelitega ühilduvad ning näiteks tekstiotsingu jaoks kasutatud semantiline indeks tuleb uute mudelite kasutamisel ümber arvutada.
Teksti mõistmise ja loomise mudelid
Lõppkasutajale kõige nähtavama on GPT-4o mini mudel, mis peaks rakendustes asendama seni kõige odavama mudeli GPT-3.5. Head optimeerimise taset näitab ka OpenAI hinnastus, kus uus mudel on varasemast u 60% odavam.
Mudel | Hinnastamine |
GPT-4o mini sisend-tokenid | $0,15 / 1 miljon tokenit |
GPT-4o mini väljund-tokenid | $0,60 / 1 miljon tokenit |
GPT-3.5 turbo sisend-tokenid | $0,50 / 1 miljon tokenit |
GPT-3.5 turbo väljund-tokenid | $1,50 / 1 miljon tokenit |
Võimekuse poolest peaks 4o mini oleme parem kui 3.5 turbo. See tähendab, et kui äriprotsessidesse on täna integreeritud GPT-3.5 mudelid (mis on pea 2 aastat vanad), on igal juhul mõistlik uuendada kood kasutama uusimat GPT-4o mudelit.
GPT-4o mini mudel on hea hea valik olukordades, kus on vaja erinevate süsteemide teksti sisend koondada üheks terviklikuks tekstiks. 3.5 põlvkonna mudelist on see oluliselt parem erinevates keeltes suhtlemisel. 3.5 mudel oskas hästi inglise keelt, kuid teiste keelte võimekus oli võrdlemisi nigel. 4o mini mudeli keeleoskus on kõvasti parem.
GPT-4o täisversioon on siiski kõige täiuslikum olukorras, kus vajad süsteemi AI analüüsi, kus erinevatest sisenditest peab AI valima õige tulemuse ning korrektselt tulemuse väljastama. Seepärast on GPT-4o kallim kui mini versioon, kuid ka siin on juba tegu optimeeritud mootoriga, mis on soodsam võimekuselt umbes samaväärse GPT-4 versiooniga.
Mudel | Hinnastamine |
GPT-4o sisend-tokenid | $5.00 / 1 miljon tokenit |
GPT-4o väljund-tokenid | $15.00 / 1 miljon tokenit |
GPT-4 sisend-tokenid | $30.00 / 1 miljon tokenit |
GPT-4 väljund-tokenid | $60.00 / 1 miljon tokenit |
Eelnevast tabelist on näha, et GPT mudelite hind on kiiresti vähenenud. 4o mudel on piisavalt optimeeritud, et selle eest 4-6 korda vähem raha küsida. Ja 4o mini mudel on veel suurusjärgu võrra odavam.
Tähenduse järgi indekseerimise mudelid
Sisu indekseerimiseks ja klassifitseerimiseks pakub OpenAI juba mõnda aega kaht uut mudelit:
- text-embedding-3-small
- text-embedding-3-large
Seejuures on small sama pika vektoriga kui seni peamiselt kasutusel olnud ada-002 mudel ja large 2 korda pikema pikema vektoriga. Small mudel on 5 korda odavam kui ada mudel. Nii small kui large mudel on saanud paremaid hindeid kui ada mudel.
Uue indekseerimise mudeli kasutusele võtmisel on vaja kogu senine andmebaas ümber indekseerida, sest uute mudelite tähenduste universum ei ole ada omaga sama kujuga.
Mudel | Hinnastamine |
text-embedding-3-small | $0.02 / 1 miljon tokenit |
text-embedding-3-large | $0.13 / 1 miljon tokenit |
text-embedding-ada-002 | $0.10 / 1 miljon tokenit |
Uute mudeli huvitav tehniline omadus on võimekus pakkuda muutuva pikkusega vektorit. See tähendab, et kui näiteks poole pikkusega vektor on piisav heade otsingutulemuste jaoks, ei ole vaja tervet vektorit indeksisse salvestada. Lühema vektori kasutamine tähendab väiksemat arvutusjõudluse vajadust otsingu tegemise hetkel – kiiremad vastused.
OpenAI teenuste kehtivaid hindasid saab kontrollida siin.