OpenAI merilis model o1 barunya pada hari Kamis, memberikan kesempatan pertama kepada pengguna ChatGPT untuk menguji model AI yang berhenti sejenak untuk “berpikir” sebelum merespons. Ada banyak atraksi yang dirancang untuk model ini, yang disebut “Strawberry” dalam OpenAI. Tapi apakah Strawberry memenuhi ekspektasi tersebut?
Agak.
Dibandingkan dengan GPT-4o, model o1 seperti maju selangkah dan mundur dua langkah. OpenAI o1 unggul dalam memikirkan dan menjawab pertanyaan kompleks, tetapi modelnya empat kali lebih mahal dibandingkan GPT-4o. Versi OpenAI saat ini tidak memiliki alat, kemampuan multimoda, dan kecepatan yang membuat GPT-4o begitu menarik. Faktanya, OpenAI bahkan mengakui bahwa “GPT-4o masih merupakan cara terbaik untuk meningkatkan data” di halaman dukungannya, menulis di tempat lain bahwa o1 kesulitan dengan tugas-tugas sederhana.
“Ini menarik, tapi menurut saya perubahannya tidak terlalu penting,” kata Ravid Shwartz Ziv, profesor NYU yang mempelajari model AI. “Dalam beberapa kasus keadaan menjadi lebih baik, tetapi tidak ada perubahan sama sekali.”
Karena semua alasan ini, penting untuk menggunakan o1 hanya untuk kueri yang dirancang untuk mendukung: dewasa. Jelasnya, saat ini kebanyakan orang tidak menggunakan AI generatif untuk menjawab pertanyaan-pertanyaan seperti ini, terutama karena model AI saat ini tidak terlalu bagus. Namun, o1 merupakan langkah tentatif ke arah tersebut.
Mencapai ide-ide besar
OpenAI o1 unik karena ia “berpikir” sebelum merespons, memecah masalah besar menjadi langkah-langkah lebih kecil, dan mencoba mengenali apakah salah satu solusinya benar atau salah. “Penalaran multivariat” ini bukanlah hal yang baru (para peneliti telah melakukannya selama bertahun-tahun, dan You.com menggunakannya untuk pertanyaan-pertanyaan kompleks), namun hal ini belum praktis hingga saat ini.
“Ada banyak kegembiraan dalam komunitas AI,” CEO Workera dan asisten profesor Stanford Kian Katanforoosh, yang mengajar kelas pembelajaran mesin, mengatakan dalam sebuah wawancara. “Jika Anda dapat mengajarkan metode pembelajaran penguatan yang dikombinasikan dengan beberapa teknik pemodelan bahasa yang dimiliki OpenAI, secara teknis Anda dapat membuatnya berpikir dalam langkah-langkah kecil dan membiarkan model AI bergerak mundur dari ide-ide besar yang coba Anda kendalikan. “
OpenAI o1 juga murah. Di sebagian besar model, Anda membayar token masukan dan token keluaran. Namun, o1 menambahkan metode tersembunyi (langkah-langkah kecil yang diselesaikan model untuk masalah besar), yang meningkatkan jumlah komputasi yang tidak Anda lihat. OpenAI menyembunyikan detail proses ini untuk mempertahankan keunggulan kompetitif. Meskipun demikian, Anda tetap dibayar untuk “pertimbangan”. Hal ini juga menekankan mengapa Anda harus berhati-hati saat menggunakan OpenAI o1, sehingga Anda tidak dikenakan biaya banyak token karena menanyakan lokasi kantor pusat Nevada.
Namun, konsep model AI yang membantu Anda “berjalan mundur dari ide-ide besar” sangatlah kuat. Dalam praktiknya, model tersebut sangat baik dalam hal itu.
Dalam satu contoh, saya meminta template ChatGPT o1 untuk membantu keluarga saya mempersiapkan diri menyambut Thanksgiving, sebuah tugas yang akan memanfaatkan pemikiran dan imajinasi yang tidak memihak. Secara khusus, saya memerlukan bantuan untuk mencari tahu apakah dua oven cukup untuk memasak makan malam Thanksgiving untuk 11 orang dan saya ingin mendiskusikan apakah kami harus mempertimbangkan untuk menyewa Airbnb untuk mendapatkan akses ke oven ketiga.
Setelah 12 detik “berpikir”, ChatGPT menulis kepada saya 750+ kata pada akhirnya yang memberi tahu saya bahwa dua oven seharusnya cukup jika direncanakan dengan matang, dan akan memungkinkan keluarga saya menghemat uang dan menghabiskan lebih banyak waktu bersama. Namun hal itu menguraikan pemikirannya kepada saya di setiap langkah dan menjelaskan bagaimana dia memikirkan semua hal di luar ini, termasuk uang, waktu bersama keluarga, dan pengelolaan oven.
Pratinjau ChatGPT o1 memberi tahu saya cara mengatur pencahayaan di rumah yang mengadakan acara, dan itu sangat brilian. Kebetulan saya memutuskan untuk menyewa oven portable. Meskipun demikian, kinerja model ini jauh lebih baik daripada GPT-4o, yang menanyakan serangkaian pertanyaan tentang makanan yang saya bawa, dan kemudian memberi saya saran sederhana yang menurut saya tidak membantu.
Bertanya tentang makan malam Thanksgiving mungkin tampak konyol, tetapi Anda dapat melihat bagaimana alat ini dapat membantu dalam menyelesaikan tugas-tugas sulit.
Saya juga meminta o1 untuk membantu saya merencanakan hari yang sibuk di tempat kerja, di mana saya harus melakukan perjalanan antara bandara, beberapa pertemuan di lokasi berbeda, dan kantor saya. Itu memberi saya rencana terperinci, tapi mungkin itu terlalu berlebihan. Terkadang, semua langkah tambahan bisa membuat Anda kewalahan.
Pada pertanyaan sederhana, o1 bereaksi berlebihan – dia tidak tahu kapan harus berhenti berpikir berlebihan. Saya bertanya di mana menemukan pohon cedar di Amerika, dan jawaban yang diberikan lebih dari 800 kata, menjelaskan semua spesies pohon cedar di negara tersebut, termasuk nama ilmiahnya. Mereka juga harus bernegosiasi dengan kebijakan OpenAI pada suatu saat, karena alasan tertentu. GPT-4o mampu menjawab pertanyaan ini dengan lebih baik, memberi saya tiga kalimat untuk menjelaskan bagaimana Anda dapat mengakses pepohonan di dunia.
Harapan yang lebih rendah
Dalam beberapa hal, Strawberry mungkin tidak menjalani kehidupan yang sama. Laporan tentang niat OpenAI dimulai pada November 2023, ketika semua orang mencari jawaban mengapa dewan OpenAI memecat Sam Altman. Hal ini memicu rumor di dunia AI, membuat beberapa orang berspekulasi bahwa Strawberry adalah salah satu bentuk AGI, jenis analisis AI yang ingin dibuat oleh OpenAI.
Altman mengonfirmasi o1 bukan AGI untuk menghilangkan keraguan, bukan berarti Anda akan bingung setelah menggunakannya. CEO juga menurunkan ekspektasi untuk peluncuran ini, dengan menulis bahwa “o1 masih memiliki kekurangan, masih kurang bertenaga, dan masih terlihat lebih mengesankan saat pertama kali Anda menggunakannya dibandingkan setelah sekian lama.”
Dunia AI lainnya sedang menghadapi peluncuran yang lebih menarik dari yang diperkirakan.
“Semacam sensasi telah berkembang dari dominasi OpenAI,” kata Rohan Pandey, seorang insinyur riset di startup AI ReWorkd, yang menciptakan grafik web dan model OpenAI.
Mereka berharap kemampuan penalaran o1 cukup untuk menyelesaikan banyak masalah yang gagal dalam GPT-4. Ini adalah gambaran yang dilihat banyak orang tentang o1, tetapi bukan sebagai pengganti GPT-4 yang ada di pasar.
Saya pikir ini sangat sederhana,” kata CEO Brightwave Mike Conover, yang juga menciptakan model AI Dolly untuk Databricks, dalam sebuah wawancara.
Berapa harganya di sini?
Prinsip utama yang digunakan dalam pembuatan o1 go bertahun-tahun yang lalu. Google menggunakan teknik yang sama pada tahun 2016 untuk menciptakan AlphaGo, metode AI pertama yang mengalahkan juara dunia dalam permainan papan Go, kata mantan Googler dan CEO perusahaan S32, Andy Harrison. AlphaGo berlatih dengan memainkan dirinya sendiri beberapa kali, pada dasarnya melatih dirinya sendiri hingga mencapai level manusia super.
Mereka mengatakan hal ini memunculkan perdebatan tertua di dunia AI.
“Kamp satu berpikir bahwa Anda dapat meningkatkan operasi melalui proses ini. Kamp kedua berpikir bahwa jika Anda memiliki kecerdasan dan pemikiran, Anda tidak akan memerlukan alur kerja, dan, seperti halnya manusia, AI hanya akan membuat penilaian,” kata Harrison dalam sebuah pernyataan. wawancara.
Harrison mengatakan dia berada di kubu pertama dan kubu kedua ingin Anda memercayai AI untuk membuat keputusan yang tepat. Dia tidak berpikir kita masih di sini.
Namun, ada pula yang menganggap o1 bukan sebagai pengambil keputusan, melainkan lebih sebagai alat untuk menanyakan pendapat Anda tentang keputusan besar.
Katanforoosh, CEO Workera, menjelaskan contoh saat dia mempekerjakan seorang data scientist untuk bekerja di perusahaannya. Dia memberi tahu OpenAI o1 bahwa dia hanya punya waktu 30 menit dan ingin menguji beberapa keterampilan. Mereka dapat bekerja mundur dengan model AI untuk memahami apakah mereka memikirkan hal ini dengan benar, dan o1 akan memahami batasan waktu dan apa yang tidak akan terjadi.
Pertanyaannya adalah apakah utilitas ini sepadan dengan harganya. Karena harga model AI terus turun, o1 adalah salah satu model AI pertama yang mengalami kenaikan harga dalam waktu yang lama.