Terlahir dari hackathon AI di San Francisco, Agensi memungkinkan Anda melihat apa yang sedang dilakukan agen AI Anda

Setelah seminggu yang panjang menulis, Anda akan berpikir bahwa para pembangun di San Francisco akan melarikan diri ke pegunungan, pantai, atau tempat clubbing di Bay Area. Namun kenyataannya, ketika minggu ini berhenti, hackathon AI dimulai.

Dalam beberapa tahun terakhir, San Francisco meledak dengan hackathon AI. Setiap hari Sabtu atau Minggu, para pakar teknis berdiskusi tentang topik terkini di bidang AI, jaringan, dan – yang paling penting – membangun ide dalam demonstrasi praktis. Dalam beberapa kasus, hackathon menawarkan hadiah seperti uang tunai atau kredit cloud, namun pemenang sesungguhnya mendapatkan pengetahuan dasar.

“Tidak ada tempat yang lebih baik di dunia untuk melakukan pekerjaan terbaik dalam hidup Anda selain San Francisco,” kata salah satu pendiri Alex Reibman. “Seringkali Anda melihat banyak kompetisi – seperti hackathon – namun tidak bersaing satu sama lain. Ini hanya kolaborasi dan bukan kompetisi.”

Musim panas lalu di hackathon San Francisco, Reibman memutuskan untuk mencoba membangun agen AI yang mampu meretas Internet. Agen menjadi topik hangat di Silicon Valley seiring dengan berkembangnya AI. Istilah ini tidak didefinisikan secara rinci, namun umumnya mengacu pada bot berbasis AI yang dapat bekerja secara otomatis, menggunakan antarmuka dan fungsi yang tidak dirancang untuk diotomatisasi – sejenis pengganti tugas-tugas tradisional yang memerlukan campur tangan manusia.

Namun Reibman langsung menghadapi masalah. “Mereka menyerapnya,” kata Reibman saat ditanya. “Agen-agen tersebut gagal sekitar 30 hingga 40%, dan seringkali dengan cara yang tidak terduga.”

Untuk memperbaikinya, tim Reibman menciptakan alat pengendalian internal untuk melihat kesalahan agen mereka. Mereka bisa mendapatkan pembantu untuk bekerja sedikit lebih baik, namun hanya peralatan rusak yang mampu mencuri perhatian dan memenangkan hackathon.

Baca juga:  Bank ICICI India memaparkan ribuan kartu kredit kepada pengguna yang 'salah'

“Saya mulai menunjukkan alat-alat tersebut di sejumlah hackathon dan acara di San Francisco, dan orang-orang mulai meminta untuk mendapatkannya,” kata Reibman. “Inilah konfirmasi yang saya perlukan: daripada membuatnya sendiri, kita harus membuat alat untuk memudahkan pembuatan pembantu.”

Jadi Reibman memulai Agensi dengan pendirinya Adam Silverman dan Shawn Qiu, menyediakan alat untuk melihat apa yang dilakukan AI, dan menangkap mereka ketika ada kesalahan. Setahun kemudian, alat tersebut menjadi alat utama Agensi, platform AgentOps, yang kini digunakan oleh ribuan tim setiap bulannya, kata Reibman kepada TechCrunch. Startup ini kini telah mengumpulkan dana awal sebesar $2,6 juta, dipimpin oleh 645 Ventures dan Afore Capital.

Chief Operating Officer Adam Silverman mengatakan kepada TechCrunch bahwa AgentOps seperti “kontrol multi-alat untuk agen”, menganalisis semua yang dilakukan agen untuk memastikan semuanya tidak berjalan dengan baik.

“Anda ingin memahami jika agen Anda melakukan kekerasan dan mencari tahu apa yang dapat Anda lakukan,” kata Silverman dalam sebuah wawancara. “Banyak pekerjaan yang harus dilakukan untuk dapat melihat di mana alat Anda berada, dan apakah agen mengikuti, sebelum alat tersebut dibuat.”

Startup ini telah bermitra dengan Cohere dan Mistral, pengembang AI yang juga menawarkan layanan berbasis agen, sehingga pelanggan dapat menggunakan dasbor AgentOps untuk melihat bagaimana agen bekerja dengan dunia, dan berapa jumlah pembelanjaan masing-masing agen. Agensi bersifat model-agnostik, artinya ia bekerja dengan berbagai sistem AI, tetapi terintegrasi dengan alat populer seperti AutoGen, CrewAI, dan AutoGPT dari Microsoft.

Selain dasbor AgentOps, Agensi juga menyediakan layanan konsultasi (Reibman sebelumnya bekerja di perusahaan EY) untuk membantu bisnis meluncurkan proyek konstruksi. Agensi tersebut tidak akan menyebutkan nama kliennya, namun menyampaikan bahwa dana lindung nilai, konsultan, dan perusahaan pialang menggunakan alat mereka.

Baca juga:  Peretas Change Healthcare melanggar penggunaan kredensial yang dicuri - dan tidak ada MFA, kata CEO UHG

Misalnya, Reibman mengatakan Agensi membantu mengembangkan asisten AI yang menulis postingan blog untuk perusahaan tempat klien bekerja. Kini, pelanggan yang sama menggunakan dasbor AgentOps untuk memantau kinerja dan biaya agen.

Pemain besar seperti OpenAI dan Google kemungkinan besar akan mengembangkan produk mereka sendiri dalam beberapa bulan mendatang, dan startup AI seperti Agency perlu mencari cara untuk bekerja sama dengan mereka, bukan melawan mereka.

“Ada begitu banyak komponen dalam tumpukan, mustahil bagi asisten LLM untuk mencoba menangani semuanya,” kata Reibman. “OpenAI dan Anthropic menciptakan pembuat dukungan, tetapi ada semua lapisan di sekitarnya untuk memastikan Anda memiliki kode siap produksi.”

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *