Pada persidangan OpenAI awal pagi tadi, model besar GPT-4o yang dinaik taraf telah dikeluarkan secara rasmi. “o” dalam GPT-4o bermaksud “omni”. GPT-4o boleh melakukan penaakulan pada audio, penglihatan dan teks dalam masa nyata. Ia juga menyokong pemprosesan lebih daripada 50 bahasa yang berbeza dan telah meningkatkan kelajuan serta kualiti dengan ketara.
Sebelum ini, purata kelewatan dialog suara GPT-3.5 ialah 2.8 saat dan GPT-4 ialah 5.4 saat. GPT-4o boleh bertindak balas kepada input audio dalam masa 232 milisaat yang menjadikannya serupa dengan perbualan manusia. Prestasi terjemahan masa nyata GPT-4o juga agak baik dan ia boleh melakukan terjemahan segera.
Menariknya, GPT-4o boleh menerima dan menjana daripada gabungan input teks, audio serta imej menjadikan interaksi manusia-komputer lebih semula jadi. GPT-4o kini boleh digunakan secara percuma tetapi akan ada had pada bilangan pengguna. Selepas pengguna percuma mencapai had, sistem akan beralih semula ke GPT-3.5 secara automatik.
Selain itu, GPT-4o akan membuka API untuk digunakan oleh pembangun. Ia adalah separuh daripada harga GPT-4-turbo tetapi memiliki prestasi dua kali lebih pantas dan mempunyai had kadar yang 5 kali lebih tinggi. GPT-4o akan dibuka secara beransur-ansur dalam beberapa minggu akan datang.
![](https://bm.technave.com/wp-content/uploads/2024/05/image-32-1024x576.png)
Selain itu, OpenAI juga telah melancarkan versi desktop ChatGPT, yang pada masa ini hanya menyokong MacOS, dan versi Windows akan dilancarkan kemudian. Kongsi pendapat anda tentang berita ini di Facebook kami dan teruskan bersama Rakan Teknologi Utama Malaysia untuk berita teknologi terkini.
Sumber: OpenAI