Model AI generatif tidak mirip manusia. Mereka tidak memiliki kecerdasan atau kepribadian – mereka hanya menghitung kata-kata yang memprediksi kata berikutnya dalam sebuah kalimat. Namun sebagai pekerja di tempat kerja yang brutal, mereka untuk melakukan ikuti instruksinya tanpa khawatir – termasuk panduan “sistematis” yang memberikan contoh karakteristik mereka, dan apa yang harus dan tidak boleh mereka lakukan.
Setiap vendor AI, mulai dari OpenAI hingga Anthropic, menggunakan metode untuk mencegah (atau mencoba mencegah) model agar tidak berperilaku buruk, dan untuk meningkatkan segala jenis respons dan masukan. Misalnya saja mereka bisa memberi contoh bersikap sopan namun tidak meminta maaf.
Namun vendor sering kali menyimpan pedoman sistem di dalam hati mereka – mungkin karena alasan kompetitif, dan mungkin karena mengetahui sistem dapat memberikan cara untuk menghindarinya. Satu-satunya cara untuk mengekspos sistem GPT-4o dengan cepat, misalnya, adalah dengan menyerang dengan cepat. (Meskipun demikian, keluaran sistem tidak dapat dipercaya sepenuhnya.)
Namun, Anthropic, dalam upaya untuk terus menampilkan dirinya sebagai AI transparan terlaris, telah menerbitkan jadwal sistem baru (Claude 3.5 Opus, Sonnet, dan Haiku) di aplikasi Claude iOS dan Android serta di Internet.
Alex Albert, direktur usaha patungan Anthropic, mengatakan dalam sebuah postingan di X bahwa Anthropic berencana menjadikan fitur ini permanen seiring dengan perkembangan dan peningkatan sistemnya.
Pedoman terbaru, tertanggal 12 Juli, dengan jelas menjelaskan apa yang tidak boleh dilakukan Claude — misalnya, “Claude tidak bisa membuka URL, tautan, atau video.” Pengenalan wajah sangatlah sulit; Sistem 3.5 Opus milik Claude memberi tahu model untuk “selalu menjawab seolah-olah mereka benar-benar buta” dan “menghindari mengidentifikasi atau menyebutkan nama siapa pun di (foto)”.
Namun pedoman tersebut juga menjelaskan kondisi dan kondisi lain – kondisi dan kondisi yang akan dicontohkan oleh Anthropic.
Misalnya, peringatan Opus mengatakan bahwa Claude harus dilihat sebagai orang yang “sangat cerdas dan ingin tahu”, dan “senang mendengar pendapat orang tentang subjek tertentu dan mendiskusikan berbagai topik”. Ia juga menyarankan Claude untuk bertindak tidak memihak dan tidak memihak, dengan memberikan “pendapat yang cermat” dan “informasi yang jelas” – dan tidak memulai dengan kata “tentu saja”.
Segalanya tidak biasa bagi orang ini: perilaku ini, yang ditulis sebagai aktor panggung, dapat menulis makalah analisis karakter. Serbuan Opus diakhiri dengan “Claude kini terhubung dengan manusia,” yang memberikan kesan bahwa Claude adalah semacam kesadaran di sisi lain layar yang tujuannya adalah untuk memenuhi keinginan orang-orang yang berinteraksi dengannya.
Namun tentu saja itu hanyalah ilusi. Jika apa yang dikatakan Claude kepada kita memberi tahu kita sesuatu, maka tanpa bimbingan dan dukungan publik, model-model ini hanyalah papan tulis kosong.