OpenAI merilis model o1 barunya pada hari Kamis, memberikan kesempatan pertama kepada pengguna ChatGPT untuk menguji model AI yang berhenti sejenak untuk “berpikir” sebelum merespons. Ada banyak atraksi yang dirancang untuk model ini, yang disebut “Strawberry” dalam OpenAI. Tapi apakah Strawberry memenuhi ekspektasi tersebut?
Agak.
Dibandingkan dengan GPT-4o, model o1 seperti maju selangkah dan mundur dua langkah. ChatGPT o1 unggul dalam percakapan dan menjawab pertanyaan kompleks, namun modelnya empat kali lebih mahal dibandingkan GPT-4o. Versi OpenAI saat ini tidak memiliki alat, kemampuan multimoda, dan kecepatan yang membuat GPT-4o begitu menarik. Faktanya, OpenAI bahkan mengakui bahwa “GPT-4o masih merupakan metode pengoptimalan terbaik” di halaman dukungannya, dan menulis di tempat lain bahwa GPT o1 kesulitan untuk tugas-tugas sederhana.
“Ini menarik, tapi menurut saya perubahannya tidak terlalu penting,” kata Ravid Shwartz Ziv, profesor NYU yang mempelajari model AI. “Dalam beberapa kasus keadaan menjadi lebih baik, tetapi tidak ada perubahan sama sekali.”
Karena semua alasan ini, penting untuk menggunakan GPT o1 untuk kueri yang dirancang untuk mendukung: dewasa. Jelasnya, saat ini kebanyakan orang tidak menggunakan AI generatif untuk menjawab pertanyaan-pertanyaan seperti ini, terutama karena model AI saat ini tidak terlalu bagus. Namun, o1 merupakan langkah tentatif ke arah tersebut.
Mencapai ide-ide besar
ChatGPT o1 unik karena ia “berpikir” sebelum merespons, memecah masalah besar menjadi langkah-langkah kecil dan mencoba mengenali apakah salah satu langkah tersebut benar atau salah. “Penalaran multivariat” ini bukanlah hal yang baru (para peneliti telah melakukannya selama bertahun-tahun, dan You.com menggunakannya untuk pertanyaan-pertanyaan kompleks), namun hal ini belum praktis hingga saat ini.
“Ada banyak kegembiraan dalam komunitas AI,” CEO Workera dan profesor Stanford Kian Katanforoosh, yang mengajar kelas pembelajaran mesin, mengatakan dalam sebuah wawancara. “Jika Anda dapat mengajarkan metode pembelajaran penguatan yang dikombinasikan dengan beberapa teknik pemodelan bahasa yang dimiliki OpenAI, secara teknis Anda dapat membuatnya berpikir dalam langkah-langkah kecil dan membiarkan model AI bergerak mundur dari ide-ide besar yang coba Anda kendalikan. “
ChatGPT o1 juga sangat tinggi. Di sebagian besar model, Anda membayar token masukan dan token keluaran. Namun, ChatGPT o1 menambahkan metode tersembunyi (langkah kecil di mana model mengacaukan masalah besar), yang meningkatkan jumlah komputer yang tidak Anda lihat. OpenAI menyembunyikan sebagian dari proses ini untuk mempertahankan keunggulan kompetitif. Meskipun demikian, Anda tetap dibayar untuk alasan “nosional”. Hal ini juga menekankan mengapa Anda harus berhati-hati saat menggunakan ChatGPT o1, sehingga Anda tidak dikenakan biaya banyak token jika menanyakan di mana ibu kota Nevada.
Namun, konsep model AI yang membantu Anda “berjalan mundur dari ide-ide besar” sangatlah kuat. Dalam praktiknya, model tersebut sangat baik dalam hal itu.
Dalam satu contoh, saya meminta template ChatGPT o1 untuk membantu keluarga saya mempersiapkan diri menyambut Thanksgiving, sebuah tugas yang akan memanfaatkan pemikiran dan imajinasi yang tidak memihak. Secara khusus, saya memerlukan bantuan untuk mencari tahu apakah dua oven cukup untuk memasak makan malam Thanksgiving untuk 11 orang dan saya ingin mendiskusikan apakah kami harus mempertimbangkan untuk menyewa Airbnb untuk mendapatkan akses ke oven ketiga.
Setelah 12 detik “berpikir”, ChatGPT menulis kepada saya 750+ kata pada akhirnya yang memberi tahu saya bahwa dua oven seharusnya cukup jika direncanakan dengan matang, dan akan memungkinkan keluarga saya menghemat uang dan menghabiskan lebih banyak waktu bersama. Namun dia menyampaikan pemikirannya kepada saya di setiap langkahnya dan menjelaskan bagaimana dia memikirkan semua hal di luar ini, termasuk uang, waktu bersama keluarga, dan pengelolaan oven.
ChatGPT o1 memberi tahu saya cara memasang sistem pencahayaan di rumah yang mengadakan acara, dan itu sangat brilian. Kebetulan saya memutuskan untuk menyewa oven portable. Meski begitu, model ini berperforma lebih baik daripada GPT-4o, yang memerlukan serangkaian pertanyaan tentang makanan yang saya bawa, lalu memberi saya petunjuk sederhana yang menurut saya berguna.
Bertanya tentang makan malam Thanksgiving mungkin tampak konyol, tetapi Anda dapat melihat bagaimana alat ini dapat membantu dalam menyelesaikan tugas-tugas sulit.
Saya juga meminta ChatGPT o1 untuk membantu saya merencanakan hari sibuk di tempat kerja, di mana saya harus melakukan perjalanan antar bandara, beberapa pertemuan tatap muka di lokasi berbeda, dan kantor saya. Itu memberi saya rencana terperinci, tapi mungkin itu terlalu berlebihan. Terkadang, semua langkah tambahan bisa membuat Anda kewalahan.
Pada pertanyaan sederhana, ChatGPT o1 bereaksi berlebihan – tidak tahu kapan harus berhenti berpikir berlebihan. Saya bertanya di mana menemukan pohon cedar di Amerika, dan jawaban yang diberikan lebih dari 800 kata, menjelaskan semua spesies pohon cedar di negara tersebut, termasuk nama ilmiahnya. Mereka juga harus bernegosiasi dengan kebijakan OpenAI pada suatu saat, karena alasan tertentu. GPT-4o mampu menjawab pertanyaan ini dengan lebih baik, memberi saya tiga kalimat untuk menjelaskan bagaimana Anda dapat mengakses pepohonan di dunia.
Harapan yang lebih rendah
Dalam beberapa hal, Strawberry mungkin tidak menjalani kehidupan yang sama. Laporan tentang niat OpenAI dimulai pada November 2023, ketika semua orang mencari jawaban mengapa dewan OpenAI memecat Sam Altman. Hal ini memicu rumor di dunia AI, membuat beberapa orang berspekulasi bahwa Strawberry adalah versi AGI, jenis analisis AI yang ingin dibuat oleh OpenAI.
Altman mengonfirmasi o1 bukan AGI untuk menghilangkan keraguan, bukan berarti Anda akan bingung setelah menggunakannya. CEO juga menurunkan ekspektasi untuk peluncuran ini, dengan menulis bahwa “o1 masih memiliki kekurangan, masih kurang bertenaga, dan masih terlihat lebih mengesankan saat pertama kali Anda menggunakannya dibandingkan setelah sekian lama.”
Dunia AI lainnya sedang menghadapi peluncuran yang lebih menarik dari yang diperkirakan.
“Semacam sensasi telah berkembang dari dominasi OpenAI,” kata Rohan Pandey, seorang insinyur riset di startup AI ReWorkd, yang menciptakan grafik web dan model OpenAI.
Mereka berharap kemampuan penalaran o1 cukup untuk menyelesaikan banyak masalah yang gagal dalam GPT-4. Banyak orang yang melihat ChatGPT o1, namun bukan sebagai pengganti GPT-4 di pasar.
Saya pikir ini sangat sederhana,” kata CEO Brightwave Mike Conover, yang juga menciptakan model AI Dolly untuk Databricks, dalam sebuah wawancara.
Berapa harganya di sini?
Prinsip utama yang digunakan dalam pembuatan o1 go bertahun-tahun yang lalu. Google menggunakan teknik yang sama pada tahun 2016 untuk menciptakan AlphaGo, metode AI pertama yang mengalahkan juara dunia dalam permainan papan Go, kata mantan Googler dan CEO perusahaan S32, Andy Harrison. AlphaGo berlatih dengan memainkan dirinya sendiri beberapa kali, pada dasarnya melatih dirinya sendiri hingga mencapai level manusia super.
Mereka mengatakan hal ini memunculkan perdebatan tertua di dunia AI.
“Kamp satu berpikir bahwa Anda dapat meningkatkan operasi melalui proses ini. Kamp kedua berpikir bahwa jika Anda memiliki kecerdasan dan pemikiran, Anda tidak akan memerlukan alur kerja, dan, seperti halnya manusia, AI hanya akan membuat penilaian,” kata Harrison dalam sebuah pernyataan. wawancara.
Harrison mengatakan dia berada di kubu pertama dan kubu kedua ingin Anda memercayai AI untuk membuat keputusan yang tepat. Dia tidak berpikir kita masih di sini.
Namun, ada pula yang menganggap o1 bukan sebagai pengambil keputusan, melainkan lebih sebagai alat untuk menanyakan pendapat Anda tentang keputusan besar.
Katanforoosh, CEO Workera, menjelaskan contoh saat dia mempekerjakan seorang data scientist untuk bekerja di perusahaannya. Dia memberi tahu ChatGPT o1 bahwa dia hanya punya waktu 30 menit dan ingin mencoba keterampilan tertentu. Mereka dapat bekerja mundur dengan model AI untuk memahami apakah mereka memikirkan hal ini dengan benar, dan ChatGPT o1 akan memahami batasan waktu dan apa yang tidak akan terjadi.
Pertanyaannya adalah apakah utilitas ini sepadan dengan harganya. Karena harga model AI terus turun, o1 adalah salah satu model AI pertama yang mengalami kenaikan harga dalam waktu yang lama.