AI & Technology
Kemampuan AI ‘Agent’ Meningkat, Model Anthropic Tantang Profesi Hukum

Ringkasan Artikel
- Rilis Anthropic Opus 4.6 meningkatkan skor pada benchmark Mercor secara signifikan
- Fitur baru seperti <i>agent swarms</i> dan kemampuan tim agent meningkatkan penyelesaian tugas berlapis
- Dampak ini mempercepat diskusi adopsi AI dalam layanan hukum dan analisis korporasi.
Anthropic merilis Opus 4.6 yang menunjukkan lonjakan kemampuan model dalam tugas profesional seperti penalaran hukum dan analisis korporasi, mengubah penilaian sebelumnya bahwa pekerjaan pengacara relatif aman dari otomatisasi. Perubahan ini terlihat pada perolehan skor di benchmark APEX-Agents yang diukur oleh perusahaan Mercor, di mana skor satu-shot naik mendekati 30% dan rata-rata hingga 45% saat diberikan beberapa kesempatan untuk menyelesaikan masalah, menurut laporan TechCrunch.
citeturn0view0Perubahan Skor dan Fitur Baru
Menurut pengamatan Mercor, peningkatan performa antara versi sebelumnya ke Opus 4.6 tergolong besar; CEO Mercor, Brendan Foody, mencatat lonjakan dari sekitar 18,4% menjadi hampir 29,8% dalam hitungan bulan. Lonjakan ini diduga terkait dengan penambahan fitur agentik dalam rilis terbaru Anthropic, termasuk apa yang disebut agent swarms atau tim agent yang mampu bekerja paralel pada masalah berlapis.
Fitur tim agent memungkinkan berbagai instance model mengambil peran berbeda—misalnya peneliti fakta, pemetaan argumen, dan penulisan draf—sehingga tugas kompleks seperti penerapan preseden hukum atau struktur perjanjian korporasi dapat dipecah dan diselesaikan lebih efektif.
citeturn0view0Implikasi Untuk Praktik Hukum dan Konsultasi Korporasi
Meskipun skor masih jauh dari sempurna dan tidak berarti pengacara akan tergantikan segera, peningkatan ini mengubah kalkulasi manajemen risiko di firma hukum dan unit legal perusahaan. Kemampuan menyelesaikan tugas berlapis dengan akurasi lebih tinggi membuka peluang untuk otomatisasi sebagian pekerjaan rutin—misalnya penelitian yurisdiksi, penelaahan dokumen standar, dan penyusunan draf awal—yang selama ini merupakan garis pekerjaan dengan biaya tinggi.
Firma hukum besar, penyedia jasa kepatuhan, dan departemen hukum korporasi yang mencari efisiensi mungkin mulai menguji integrasi model agentik seperti Opus 4.6 untuk menurunkan biaya operasional dan mempercepat waktu penyampaian. Namun, pengawasan kualitas, tanggung jawab profesional, dan risiko regulasi tetap menjadi hambatan adopsi cepat.
citeturn0view0Reaksi Pemangku Kepentingan dan Benchmarking
Hasil terbaru memicu ulang perdebatan tentang validitas dan cakupan benchmark profesional. Mercor, yang mengoperasikan APEX-Agents Leaderboard, menjadi acuan untuk mengukur kemampuan multi-langkah model dalam domain profesional, tetapi para analis menekankan bahwa benchmark satu-per-tingkat tidak selalu merefleksikan realitas praktik hukum yang melibatkan tanggung jawab etis dan konteks bisnis.
Pendukung perkembangan AI menilai lonjakan ini sebagai tanda bahwa investasi pada model fondasi dan arsitektur agentik membuahkan hasil teknis, sementara kritikus mengingatkan kebutuhan uji coba lapangan, audit kinerja, dan penerapan kontrol manusia dalam proses akhir.
citeturn0view0Rekomendasi Untuk Pengambil Keputusan
Bagi pembuat keputusan di firma hukum dan korporasi, langkah awal yang disarankan adalah menjalankan pilot terukur yang memadukan Opus 4.6 atau model agentik serupa dengan pengawasan profesional internal. Pilot harus fokus pada tugas berulang dan non-keputusan strategis, serta menyertakan metrik keamanan, akurasi, dan kepatuhan.
Investor dan penyedia teknologi hukum juga perlu memantau perkembangan benchmark seperti APEX-Agents, transparansi perubahan model dari Anthropic, serta kebijakan regulasi yang muncul terkait penggunaan AI di layanan hukum.
citeturn0view0