Peluncuran Claude Opus 4.7. Penjelasan Mendalam tentang Fitur-Fitur Baru dari Perspektif Teknisi Tech Silicon Valley

Pada artikel kemarin, kami telah menyampaikan gambaran umum Claude Opus 4.7 berdasarkan laporan eksklusif dari The Information dan kebocoran dari konsol Google Vertex AI. Namun pada artikel ini, kami akan mengupas secara mendalam detail fitur-fitur baru berdasarkan model yang dirilis resmi oleh Anthropic pada 16 April 2026 waktu setempat, dilihat dari perspektif engineer teknologi Silicon Valley. Opus 4.7 mencatatkan skor SWE-bench Pro 64,3%, SWE-bench Verified 87,6%, dan CursorBench 70%, melampaui GPT-5.4 dari OpenAI dan Gemini 3.1 Pro dari Google pada benchmark-benchmark utama. Yang paling patut diperhatikan adalah tiga hal berikut: level inferensi baru `xhigh`, `task_budget` yang kini dalam versi beta publik, serta visi high-definition native dengan resolusi tiga kali lebih tinggi. Di sisi lain, terdapat beberapa Breaking Change pada codebase yang sudah ada, termasuk penghapusan total parameter sampling seperti `temperature` dan `top_p`, penghapusan Extended Thinking (fixed-budget thinking), dan penyembunyian konten pemikiran secara default, sehingga migrasi memerlukan penyesuaian ulang yang cermat. Harga tetap sama yaitu $5 (sekitar 795 yen) untuk input dan $25 (sekitar 3.978 yen) untuk output per satu juta token, namun tokenizer baru mengonsumsi hingga 1,35 kali lebih banyak token untuk teks yang sama, sehingga secara efektif biaya aktual menjadi lebih tinggi.

Ringkasan

Pada artikel kemarin, kami menyampaikan gambaran umum Claude Opus 4.7 berdasarkan laporan eksklusif The Information dan kebocoran dari konsol Google Vertex AI. Namun pada artikel ini, kami akan mengupas secara mendalam detail fitur-fitur baru berdasarkan model yang dirilis resmi oleh Anthropic pada 16 April 2026 waktu setempat, dari sudut pandang engineer teknologi Silicon Valley. Opus 4.7 mencatatkan skor SWE-bench Pro 64,3%, SWE-bench Verified 87,6%, dan CursorBench 70%, meninggalkan GPT-5.4 dari OpenAI dan Gemini 3.1 Pro dari Google pada benchmark-benchmark utama. Tiga hal yang paling patut diperhatikan adalah level inferensi baru xhigh, task_budget dalam versi beta publik, dan native high-definition vision dengan resolusi tiga kali lebih tinggi. Di sisi lain, terdapat beberapa perubahan yang bersifat merusak (Breaking Change) pada codebase yang sudah ada, seperti penghapusan total parameter sampling seperti temperature dan top_p, penghapusan Extended Thinking (fixed-budget thinking), serta penyembunyian konten pemikiran secara default, sehingga diperlukan penyesuaian ulang yang cermat saat melakukan migrasi. Harga tetap sama yaitu input $5 (sekitar 795 yen) / output $25 (sekitar 3.978 yen) per 1 juta token, namun karena tokenizer baru mengonsumsi hingga 1,35 kali lebih banyak token untuk teks yang sama, struktur biaya aktualnya menjadi lebih tinggi.

48 Jam Setelah Laporan Kebocoran, Anthropic Menunjukkan "Penghancuran dan Kelanjutan"

Anthropic secara resmi merilis Claude Opus 4.7 pada 16 April 2026 (waktu Pasifik AS), sebuah peluncuran yang telah menjadi pusat perhatian industri AI generatif. Pengumuman resmi ini sangat cepat — hanya sekitar 48 jam setelah The Information menerbitkan laporan eksklusifnya pada malam 14 April, dan hanya 24 jam setelah bocornya ID model di konsol Google Vertex AI. Prediksi "rilis 16 April" yang dipasang dengan probabilitas implisit 79% di Polymarket pun terbukti tepat, dan para peserta pasar prediksi menerima pembayaran mereka.

Nada blog resmi bertajuk *Introducing Claude Opus 4.7* sangat berbeda dari peluncuran Opus 4.6 generasi sebelumnya yang penuh gegap gempita dengan kesan "tirai era baru telah dibuka" — kali ini Anthropic tampil sangat pragmatis dan tenang. Anthropic secara lugas menyatakan bahwa "Opus 4.7 merupakan peningkatan signifikan dari Opus 4.6, dengan pencapaian yang sangat besar terutama pada tugas-tugas paling sulit," sekaligus secara terbuka mengakui bahwa "meski merupakan model terkuat yang tersedia untuk publik, kemampuannya belum menandingi Claude Mythos Preview yang belum dirilis." CNBC melaporkannya sebagai "model AI yang lebih rendah risiko dibanding Mythos," sementara Axios menyoroti "pengakuan bahwa kemampuannya belum menandingi Mythos yang belum dirilis" — keduanya menegaskan bahwa Anthropic secara sadar menerapkan strategi dua lapis yang memisahkan "hasil penelitian mutakhir internal" dari "produk komersial."

Artikel ini menyusun perubahan-perubahan yang ada berdasarkan sumber primer — yakni dokumentasi resmi Anthropic, unggahan media sosial para karyawan, dan pernyataan resmi perusahaan mitra — kemudian mengintegrasikannya dengan data pengukuran nyata dari tim engineering mitra adopsi awal seperti CodeRabbit, Warp, Cursor, dan Factory Droids, respons komunitas teknisi di Hacker News, serta pandangan para VC Silicon Valley, guna mengurai secara menyeluruh "apa yang berubah," "bagaimana cara memanfaatkannya," dan "bagaimana model ini diterima."

Angka resmi tepat setelah rilis——benchmark bukan "perubahan tektonik" melainkan "peningkatan yang stabil"

Menggabungkan angka-angka yang dipublikasikan di blog resmi Anthropic, blog resmi AWS Bedrock, dan blog Google Cloud Vertex AI, berikut adalah benchmark utama Opus 4.7.

Benchmark Coding

Benchmark	Opus 4.7	Opus 4.6	GPT-5.4	Gemini 3.1 Pro
SWE-bench Pro	64,3%	53,4%	57,7%	54,2%
SWE-bench Verified	87,6%	80,8%	80,6%	80,6%
Terminal-Bench 2.0	69,4%	65,4%	Tidak dipublikasikan	Tidak dipublikasikan
CursorBench	70%	58%	Tidak dipublikasikan	Tidak dipublikasikan

Peningkatan 10,9 poin pada SWE-bench Pro merupakan "pergeseran tektonik" yang nyata, mengingat peningkatan dari dua generasi sebelumnya hanya berkisar 2–3 poin. Namun angka ini masih jauh dari 93,9% yang dicatat oleh Mythos Preview yang belum dipublikasikan. Struktur di mana Anthropic mengklaim "yang terkuat untuk umum" sambil menyimpan "yang terkuat yang dikurung" secara internal pun terbaca jelas dari benchmark ini.

Multimodal & Pekerjaan Intelektual

GDPVal-AA (pekerjaan intelektual bernilai ekonomis): Elo 1753 (GPT-5.4: 1674, Gemini 3.1 Pro: 1314)
Finance Agent v1.1: 64,4% (tertinggi di industri)
GPQA Diamond (penalaran tingkat pascasarjana): 94,2% (hampir setara dengan GPT-5.4 Pro 94,4% dan Gemini 3.1 Pro 94,3%)
Akurasi Visual XBOW (Visual Acuity): 98,5% (peningkatan signifikan dari 54,5% pada Opus 4.6)
OfficeQA Pro (penalaran dokumen): pengurangan error 21%
Rakuten-SWE-Bench: tingkat penyelesaian tugas di lingkungan produksi meningkat 3 kali lipat

Yang menarik adalah hasil GPQA Diamond, di mana seperti yang ditunjukkan oleh The Next Web, "perbedaan antar model frontier utama sudah konvergen dalam batas noise." Era persaingan murni skor penalaran telah berakhir, dan sumbu diferensiasi telah sepenuhnya beralih ke "performa aplikasi," "eksekusi agen," dan "akurasi multimodal."

【Inti】Detail Teknis Fitur Baru——Dikutip Langsung dari Dokumentasi Resmi Anthropic

Ini adalah inti dari artikel ini. Berdasarkan dokumentasi resmi Anthropic (platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-7), kita akan memverifikasi fitur-fitur baru dari sumber primer.

1. Level Penalaran `xhigh` — "Sweet Spot antara Biaya dan Kecerdasan"

Fitur baru yang paling menonjol di Opus 4.7 adalah penambahan 5 tingkat pada parameter effort. Sebelumnya hanya ada 4 tingkat yaitu low / medium / high / max, kini ditambahkan xhigh yang berada di antara high dan max.

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=12000,
    thinking={"type": "adaptive"},
    output_config={"effort": "xhigh"},
    messages=[{"role": "user", "content": "Refactor this codebase..."}]
)

Boris Cherny, penulis Claude Code, menyatakan dalam postingan X-nya (16 April): "Opus 4.7 uses adaptive thinking instead of thinking budgets. To tune the model to think more/less, we recommend tuning effort." Ia secara tegas menyebutkan bahwa Claude Code telah menetapkan xhigh sebagai default di semua paket. Ini merupakan sinyal penting bagi para engineer, yang dijelaskan sebagai keputusan yang diambil menanggapi masukan dari developer bahwa "'high' tidak cukup untuk menangkap kualitas dalam workflow agentic coding."

Panduan resmi Anthropic per level effort adalah sebagai berikut.

Level	Penggunaan yang Direkomendasikan
`low` / `medium`	Prioritas biaya dan latensi, tugas bercakupan sempit
`high`	Keseimbangan antara kecerdasan dan biaya, operasi sesi paralel
`xhigh` (default Claude Code)	Sebagian besar tugas coding dan agen
`max`	Hanya untuk masalah yang benar-benar sulit. Risiko overthinking pada eksekusi panjang

Menurut analisis Vellum AI, "level effort low pada Opus 4.7 kurang lebih setara dengan level medium pada Opus 4.6," mengkonfirmasi bahwa peningkatan menyeluruh terjadi di semua level.

2. Task Budgets (Beta Publik) — Solusi Utama untuk Mencegah Agen Tak Terkendali

task_budget adalah parameter baru yang memberi tahu model "selesaikan tugas ini kira-kira dengan anggaran token sebesar ini" untuk seluruh loop agen (termasuk pemikiran, pemanggilan alat, hasil alat, dan output akhir). Yang penting, ini adalah konsep yang secara fundamental berbeda dari max_tokens.

response = client.beta.messages.create(
    model="claude-opus-4-7",
    max_tokens=128000,
    output_config={
        "effort": "high",
        "task_budget": {"type": "tokens", "total": 128000},
    },
    messages=[{"role": "user", "content": "Review the codebase..."}],
    betas=["task-budgets-2026-03-13"],
)

Dokumentasi resmi Anthropic membedakan keduanya dengan jelas: "max_tokens adalah hard cap token yang dihasilkan per request (tidak dikomunikasikan ke model), sedangkan task_budget adalah advisory cap untuk seluruh loop agen (dikomunikasikan ke model, yang mengatur diri sendiri dengan melihat hitungan mundur)". Nilai minimum adalah 20.000 token, dan perlu mencantumkan header beta task-budgets-2026-03-13.

Yang sangat berguna bagi para engineer adalah kemampuan model untuk menyadari hitungan mundur anggaran yang tersisa. Saat anggaran berkurang, model mempersempit eksplorasi dan memprioritaskan output penting untuk menyelesaikan tugas "secara graceful (anggun)". Di komunitas engineer Silicon Valley, ini disambut sebagai solusi untuk masalah "biaya tak terkendali" saat mengoperasikan Claude Code. Namun Anthropic sendiri merekomendasikan "jangan tetapkan task_budget untuk tugas agen open-ended yang mengutamakan kualitas." Hal ini karena memberikan anggaran yang terlalu ketat dapat menyebabkan tugas diselesaikan setengah-setengah atau bahkan ditolak sepenuhnya.

3. Native Vision Resolusi Tinggi — 2.576px / 3,75MP

Peningkatan kemampuan vision adalah lompatan arsitektur terbesar di Opus 4.7.

Resolusi maksimum: 2.576px (sisi terpanjang, 3,75 megapiksel, lebih dari 3x lipat dari 1.568px/1,15 megapiksel sebelumnya)
XBOW Visual Acuity: 54,5% → 98,5% (akurasi ultra-tinggi dalam pengenalan teks satu tembakan)
Persepsi level rendah: Peningkatan akurasi dalam pointing, pengukuran, dan penghitungan
Lokalisasi gambar: Peningkatan deteksi bounding box pada gambar natural
Pemetaan koordinat: Koordinat gambar berkorespondensi 1:1 dengan piksel (tidak perlu menghitung faktor skala)

"Pemetaan koordinat 1:1" yang terakhir adalah kabar baik bagi developer agen yang menggunakan Computer Use (membuat Claude mengoperasikan mouse) atau analisis screenshot. Hingga Opus 4.6, koordinat yang dihasilkan model berada dalam sistem gambar setelah resize internal, sehingga memerlukan konversi yang merepotkan untuk memetakannya ke gambar asli. Tidak diperlukannya lagi hal ini memiliki signifikansi besar.

Gabriel Anhaia dari Dev.to melaporkan dalam pengujian hands-on selama 6 jam: "membaca screenshot terminal yang padat dengan sempurna — setiap baris, kode keluar, timestamp, bahkan teks abu-abu terang dari prompt zsh."

Namun Anthropic secara eksplisit menyebutkan: "gambar beresolusi tinggi mengonsumsi lebih banyak token. Lakukan downsampling terlebih dahulu jika detail tidak diperlukan." Dari perspektif engineer, manajemen resolusi yang disesuaikan dengan penggunaan gambar input menjadi titik optimasi biaya baru.

4. [Perubahan Merusak] Penghapusan Total Extended Thinking (Pemikiran Anggaran Tetap)

Perubahan merusak yang paling berdampak pada banyak codebase di Opus 4.7 adalah ini. Mode pemikiran anggaran tetap thinking={"type": "enabled", "budget_tokens": N} yang sebelumnya ada telah dihapus, dan jika ditentukan akan mengembalikan error 400. Sebagai gantinya, hanya Adaptive Thinking ({"type": "adaptive"}) yang didukung.

# Hingga Opus 4.6
thinking = {"type": "enabled", "budget_tokens": 32000}

# Opus 4.7 dan seterusnya
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

Yang perlu diperhatikan lebih lanjut adalah bahwa Adaptive Thinking secara default NONAKTIF. Request yang tidak secara eksplisit menentukan field thinking akan dieksekusi tanpa pemikiran. Anthropic menjelaskan dalam evaluasi internal bahwa "Adaptive Thinking secara konsisten mengungguli Extended Thinking," namun dalam diskusi Hacker News (47793411), banyak laporan kritis seperti "adaptive thinking chooses to not think when it should", dengan keluhan membludak mengenai kasus di mana model melewatkan pemikiran saat seharusnya berpikir.

5. [Perubahan Merusak] Penghapusan Total Parameter Sampling

Mengatur salah satu dari temperature, top_p, atau top_k ke nilai selain default akan menghasilkan error 400. Jalur migrasi yang direkomendasikan adalah menghapus sepenuhnya parameter-parameter ini dari request.

Anthropic menyatakan dengan tegas: "Meskipun Anda menggunakan temperature=0 untuk determinisme, hal itu tidak pernah menjamin keidentikan output." Filosofi Anthropic adalah bahwa jika ingin mengontrol perilaku model, lakukanlah melalui prompt engineering.

6. [Perubahan Merusak] Konten Pemikiran Tersembunyi Secara Default

Secara default, blok pemikiran muncul dalam stream respons, tetapi field thinking akan kosong. Produk yang memiliki UI untuk menampilkan proses penalaran kepada pengguna perlu melakukan opt-in secara eksplisit.

thinking = {
    "type": "adaptive",
    "display": "summarized",  # atau "omitted" (default)
}

Resmi Anthropic menyatakan latensi sedikit membaik, namun di Hacker News terdapat diskusi tentang penurunan UX berupa "output yang dimulai setelah keheningan panjang." Bagi produk dengan streaming UI, pengaturan "display": "summarized" kemungkinan besar akan menjadi keharusan de facto.

7. Tokenizer Baru — Hingga 1,35x Token untuk Input yang Sama

Perubahan yang sering diabaikan tetapi paling menyakitkan bagi engineer adalah ini. Opus 4.7 mengadopsi tokenizer baru yang mengonsumsi 1,0 hingga 1,35x token untuk teks yang sama. Menurut analisis Finout, peningkatan jumlah token lebih signifikan pada JSON dan data terstruktur (1,2 hingga 1,35x), sementara hampir tidak ada perubahan pada prosa bahasa Inggris murni.

Meskipun harga per unit tidak berubah secara nominal, biaya aktual meningkat dalam bentuk "request $0,10 menjadi $0,135 di Opus 4.7." Finout menyarankan bahwa "bagi banyak tim, jawabannya bukan 'upgrade ke 4.7' melainkan 'pindahkan setengah traffic ke Sonnet'," dan memberikan peringatan kepada para CFO di Silicon Valley.

Peningkatan premium request multiplier di GitHub Copilot dari 3x untuk Opus 4.6 menjadi 7,5x untuk Opus 4.7 (harga promosi hingga 30 April) juga diperkirakan mencerminkan peningkatan token ini.

8. Pengamanan Keamanan Siber Real-Time

Opus 4.7 dilengkapi mekanisme yang secara otomatis mendeteksi dan memblokir penggunaan keamanan siber yang dilarang atau berisiko tinggi. Bagi profesional keamanan yang bertujuan untuk penelitian kerentanan yang sah, pengujian penetrasi, dan red teaming, tersedia panduan untuk mengajukan permohonan ke "Cyber Verification Program" baru (claude.com/form/cyber-use-case).

Ini dirancang berpasangan dengan Mythos Preview, dan Anthropic mengakui telah "melakukan eksperimen untuk mengurangi kemampuan siber secara diferensial selama pelatihan agar tidak memberikan kemampuan setara Mythos ke model yang dirilis secara umum." Help Net Security melaporkan "ini bukan penurunan kemampuan model, melainkan scoping yang disengaja."

Poin Peningkatan Claude Code——Perubahan di Lapangan yang Hanya Dirasakan oleh Para Engineer

Bersamaan dengan peluncuran Opus 4.7, beberapa peningkatan fitur juga dilakukan pada sisi Claude Code.

Penambahan Perintah `/ultrareview`

Sesi tinjauan kode khusus yang dijalankan pada level efek max, menganalisis arsitektur, logika, keamanan, performa, dan keterpeliharaan dalam format terstruktur. Pengguna Pro/Max mendapatkan kredit 3 kali gratis per bulan.

CodeRabbit mengevaluasi dengan 100 PR OSS nyata dan menyatakan "Opus 4.7 adalah model paling tajam." Dalam evaluasi deteksi bug, meraih 68/100 poin, kepadatan bug per 100 komentar mencapai 70% (bug substansial, bukan sekadar catatan gaya penulisan), 99,1% komentar menyertakan referensi kode inline, dan 78% mengandung diff yang dapat diterapkan — menunjukkan kemampuan tinjauan yang sangat praktis.

Di sisi lain, CodeRabbit juga mencatat beberapa kekurangan yang jelas: "Pelabelan tingkat keparahan yang terlalu ketat (cenderung memberi label critical bahkan pada kegagalan khusus pengujian)", "jumlah komentar yang berlebihan (rata-rata lebih dari 19 per PR)", dan "penunjukan duplikat pada jalur kode yang serupa." Filtering melalui post-processing dinyatakan wajib saat digunakan di lingkungan produksi.

Perluasan Auto Mode

"Auto Mode" (Shift+Tab) yang memungkinkan Claude secara otonom menjalankan perintah terminal, mengedit file, dan melakukan iterasi — sebelumnya terbatas hanya untuk Enterprise/Teams — kini dibuka juga untuk pelanggan paket Max bersamaan dengan peluncuran Opus 4.7.

Penghapusan Bertahap Model Lama

GitHub Copilot mengumumkan akan menghapus secara bertahap Opus 4.5 dan 4.6 dari pemilih model bagi pengguna Pro+ selama beberapa minggu ke depan. Hal ini dijelaskan sebagai bagian dari upaya peningkatan keandalan, namun pengguna enterprise perlu menyusun rencana migrasi sebelum 30 April.

Perubahan bagi pengguna non-engineer——Claude yang "sedikit lebih pendiam dan profesional"

Bagi pengguna bisnis dan non-engineer yang menggunakan Claude.ai atau aplikasi desktop sehari-hari, perubahan pada Opus 4.7 akan terasa sebagai berikut.

Perubahan Perilaku (yang memerlukan penulisan ulang prompt)

Dikutip dari bagian 'Behavior changes' resmi Anthropic:

1. Mengikuti instruksi secara lebih harfiah: Claude versi sebelumnya cenderung "menerapkan instruksi untuk satu item secara implisit ke item lain," tetapi Opus 4.7 hanya melakukan apa yang diminta. Misalnya, jika Anda menginstruksikan "ubah komentar kode ini ke bahasa Inggris," nama variabel tidak akan diubah kecuali Anda secara eksplisit memintanya.

2. Panjang respons disesuaikan otomatis dengan kompleksitas tugas: Kalibrasi diperkuat — pertanyaan singkat dijawab singkat, pertanyaan kompleks dijawab panjang. Kecenderungan menjawab dengan tingkat verbositas yang tetap pun berkurang.

3. Penggunaan alat (tool calls) berkurang: Secara default, Claude lebih berusaha menyelesaikan tugas dengan penalaran. Untuk kasus yang memerlukan pencarian web, instruksi eksplisit disarankan.

4. Nada yang lebih langsung dan asertif: Dibandingkan "gaya hangat Claude Opus 4.6," gayanya lebih langsung dan tegas dalam menyampaikan pendapat. Penggunaan emoji berkurang, dan bentuk imperatif seperti "Guard against nil" meningkat. CodeRabbit memberikan evaluasi kuantitatif berupa "tingkat asertivitas 77,6%, tingkat hedging 16,5%."

5. Laporan progres lebih sering saat tugas berjalan lama: Status perantara seperti "Sedang memproses X" atau "Akan memproses sisa Y" disisipkan secara alami.

6. Tidak menghasilkan sub-agen secara default: Versi sebelumnya cenderung memulai pemrosesan paralel secara otomatis, tetapi Opus 4.7 lebih menahan diri. Jika ingin paralelisasi, instruksi eksplisit diperlukan.

Aj Orbach, CEO (perusahaan pembuat dashboard), menilai: "Selera desain Opus 4.7 terhadap UI yang kaya data adalah kualitas yang benar-benar saya rilis." Di kalangan desainer Silicon Valley, hal ini dibicarakan dalam konteks "AI mulai memiliki 'taste'."

Tips Penggunaan (untuk non-engineer)

"Berikan instruksi yang cukup eksplisit": Jangan bergantung pada ekspektasi implisit — nyatakan panjang, format, dan nada output yang diinginkan sejak awal dalam prompt.
Sadari tingkat efek untuk tugas jangka panjang: Tingkat efek juga terekspos kepada pengguna di UI Claude.ai. Disarankan untuk menggunakan medium untuk tugas sederhana, high untuk tugas berpikir yang penting, dan xhigh untuk coding atau analisis yang sulit.
Perhatikan resolusi screenshot: Berkat dukungan resolusi tinggi, screenshot dari ponsel maupun gambar grafik beresolusi tinggi kini dapat dibaca secara akurat. Akurasi tugas seperti membaca angka dalam tabel atau sumbu grafik meningkat secara signifikan.

"Tips dan Trik" yang Hanya Diketahui Engineer——Teknik yang Ditemukan oleh Komunitas

Dari Hacker News (47793411), utas Twitter Boris Cherny, artikel uji coba 6 jam di Dev.to, serta laporan mitra CodeRabbit/Warp/Vercel/Cursor, berikut adalah kumpulan tips yang ditemukan oleh komunitas engineering.

Tips 1: Gunakan `xhigh` secara rutin, jadikan `max` sebagai pengecualian

Anthropic secara resmi menyatakan: "Gunakan max hanya untuk masalah yang benar-benar sulit. Pada eksekusi jangka panjang, berpikir berlebihan justru bisa berdampak negatif." Banyak engineer di Silicon Valley berbagi pandangan yang sama: "Jika xhigh pada Opus 4.7 sudah mentok, tinjau kembali promptnya. Jarang sekali masalah terselesaikan hanya dengan menaikkan ke max."

Tips 2: Gunakan plan mode terlebih dahulu

Boris Cherny telah konsisten menyampaikan sejak era Opus 4.5: "Hampir selalu memulai dengan plan mode adalah tips terbesar." Prinsip ini tidak berubah di Opus 4.7. Dengan menyepakati rencana yang detail sebelum masuk ke implementasi, kemampuan Opus 4.7 dalam "mengikuti instruksi secara lebih harfiah" akan menjadi keunggulan terbesar.

Tips 3: Hapus scaffolding lama

Dokumentasi Opus 4.7 secara eksplisit menyebutkan: "Jika prompt yang ada mengandung scaffolding korektif seperti double-check the slide layout before returning, hapus dan lakukan re-baseline." Karena model kini melakukan verifikasi mandiri, instruksi defensif yang dirancang untuk generasi sebelumnya justru dapat memicu redundansi atau koreksi berlebihan.

Tips 4: Aktifkan kembali thinking summary di Claude Code

Secara default, isi pemikiran disembunyikan, namun pengguna Claude Code dapat mengaktifkannya kembali dengan pengaturan showThinkingSummaries: true. Bagi yang menggunakan API secara langsung, tambahkan "display": "summarized" ke dalam request.

Tips 5: Kendalikan biaya context window 1M

Dengan variabel lingkungan CLAUDE_CODE_DISABLE_1M_CONTEXT=1, context window 1M dapat dinonaktifkan untuk menekan biaya. Efektif digunakan pada skenario yang tidak memerlukan penanganan repositori berskala besar.

Tips 6: Mental model "mendelegasikan ke engineer"

Blog resmi Anthropic, *Best practices for using Claude Opus 4.7 with Claude Code*, secara eksplisit menyatakan: "Gunakan Opus 4.7 bukan sebagai pair programmer yang dibimbing baris per baris, melainkan seperti mendelegasikan tugas kepada engineer yang kompeten." Menyampaikan niat, batasan, kriteria penerimaan, dan lokasi file yang relevan sekaligus di giliran pertama akan memaksimalkan otonomi Opus 4.7.

Tips 7: Kombinasikan prompt cache dengan Sonnet

Analisis Finout menunjukkan: "Leverage terbesar untuk mengendalikan biaya Opus adalah prompt cache (pengurangan hingga 90%)." Lebih lanjut, "bagi banyak tim, lebih masuk akal untuk mengalihkan setengah traffic ke Sonnet 4.6." Simulasi menunjukkan bahwa beban kerja RAG senilai $652 per bulan turun menjadi $392 dengan Sonnet 4.6.

Tips 8: Task budget hanya untuk closed task

Anthropic secara resmi menegaskan: "Jangan tetapkan task_budget untuk tugas agen open-ended yang mengutamakan kualitas di atas kecepatan." Fitur ini sebaiknya hanya dimanfaatkan untuk closed task yang jelas cakupannya, seperti "menyelesaikan review 100 file" atau "menyelesaikan rencana refactoring."

Tips 9: Jalankan A/B test sebagian pengujian yang ada dengan 5–10% traffic

Panduan developer NxCode sangat merekomendasikan "A/B test dengan 5-10% traffic sebelum peluncuran penuh ke produksi." Karena banyak perubahan yang memerlukan penyesuaian ulang prompt — seperti peningkatan tokenizer 1,35x dan pengetatan kepatuhan instruksi — rollout bertahap menjadi prosedur standar untuk meminimalkan risiko.

Data pengukuran aktual dari masing-masing perusahaan mitra enterprise

Berikut adalah rangkuman data kuantitatif dari perusahaan-perusahaan enterprise yang menjadi adopter awal, berdasarkan blog resmi Anthropic dan pengumuman masing-masing perusahaan.

CodeRabbit: "Model paling tajam", peningkatan recall lebih dari 10%, peningkatan relatif deteksi bug sebesar 24%
Warp: "Menyelesaikan bug konkurensi yang tidak bisa dipecahkan oleh Opus 4.6" "Menyeluruh secara terukur"
Factory Droids: Tingkat keberhasilan tugas naik 10-15%, pengurangan error pemanggilan tool, "tidak berhenti di tengah jalan"
Cursor: CursorBench 58% → 70% (peningkatan 12 poin)
Vercel: "Luar biasa untuk one-shot coding" "Perilaku baru yang melakukan pra-verifikasi kode sistem"
Box (Yashodha Bhavnani, Kepala AI): Pengurangan pemanggilan model 56%, pengurangan pemanggilan tool 50%, respons lebih cepat 24%, pengurangan AI Units 30%
Notion: "Notion Agent terasa seperti rekan tim yang sesungguhnya"
Rakuten (楽天): Tingkat penyelesaian tugas produksi meningkat 3x, peningkatan dua digit pada Code Quality dan Test Quality
Hebbia: Peningkatan pengambilan keputusan agen untuk RAG, pembuatan slide, dan pembuatan dokumen

Angka-angka dari Box sangat mengungkapkan. Fakta bahwa pemanggilan model berkurang lebih dari setengahnya sambil mencapai performa yang sama berarti, dari perspektif TCO (Total Cost of Ownership) enterprise, dapat diharapkan dampak ekonomi yang melampaui peningkatan tokenizer sebesar 1,35x.

Tanggapan VC Silicon Valley — "Apakah 800 miliar dianggap sebagai tiket masuk menuju juara AI, atau kegilaan?"

Peluncuran Opus 4.7 juga merupakan peristiwa evaluasi yang signifikan bagi komunitas VC.

Makna Penawaran Valuasi $800 Miliar

Menurut laporan Bloomberg, Yahoo Finance, dan GuruFocus, Anthropic menerima beberapa penawaran investasi dari sejumlah VC dengan valuasi $800 miliar (sekitar 127,2 kuadriliun rupiah) bersamaan dengan peluncuran Opus 4.7. Laju ekspansi yang melampaui dua kali lipat hanya dalam dua bulan sejak Series G bulan Februari 2026 (senilai $380 miliar atau sekitar 60,42 kuadriliun rupiah) merupakan hal yang sangat tidak lazim bahkan dalam sejarah teknologi. Di pasar sekunder Caplight, $688 miliar (sekitar 109,39 kuadriliun rupiah) menjadi harga transaksi aktual, mencatatkan kenaikan 75% dalam tiga bulan.

Di balik angka-angka tersebut terdapat rekam jejak ARR perusahaan sebesar $30 miliar (sekitar 4,77 kuadriliun rupiah). InvestorPlace menyebutnya sebagai "pertumbuhan pendapatan 10.000% year-on-year" dan memposisikannya sebagai "kandidat IPO terbesar tahun 2026."

Perspektif Tenang dari Altimeter

Brad Gerstner dari Altimeter Capital menyatakan sekitar tanggal 16 April bahwa "FUD terhadap OpenAI telah mencapai puncaknya" dan "sangat bodoh untuk menyingkirkan OpenAI," memberikan peringatan terhadap pandangan yang terlalu berpusat pada Anthropic. Ia berpendapat bahwa "pasar AI bukan zero-sum. Ada ruang yang cukup untuk banyak pemenang," dan mengungkapkan harapan bahwa Spud (model yang belum dipublikasikan) milik OpenAI akan "setara dengan Mythos."

Mayoritas VC Silicon Valley memandang peluncuran Opus 4.7 sebagai "bahan yang mendukung momentum Anthropic," namun tetap berhati-hati dalam menerima valuasi $800 miliar. Anthropic sendiri juga menahan penawaran tersebut "untuk saat ini," dan valuasi tersebut diinterpretasikan sebagai sikap menunggu "pertumbuhan bisnis lebih lanjut sebelum IPO."

Apa yang Ditunjukkan oleh Survei CIO a16z

Dalam survei CIO yang dilakukan oleh a16z, wallet share (pangsa anggaran AI) OpenAI masih mendominasi dengan 56%. Namun Anthropic dan Gemini terus menggerus pangsa tersebut secara konsisten, dengan proyeksi bahwa pergeseran tersebut akan semakin cepat pada tahun 2026. Analisis yang dominan menyatakan bahwa diferensiasi pasar di mana "Anthropic unggul di kalangan developer dan penulis yang mengutamakan akurasi dan kemampuan coding, sementara OpenAI dan Google menguasai skala konsumen dan kekuatan distribusi" akan tetap menjadi struktur dasar bahkan setelah peluncuran Opus 4.7.

Dampak pada Saham Terkait

Di pasar saham segera setelah peluncuran Opus 4.7, Adobe, Figma, dan Wix masing-masing turun lebih dari 2%. Hal ini sebagian dipengaruhi oleh laporan bocoran sehari sebelumnya yang telah terefleksikan dalam harga saham, namun juga menunjukkan bahwa skenario "Anthropic beralih menjadi studio AI full-stack bersamaan dengan alat desain AI 'Project Prism'" menjadi faktor kewaspadaan bagi para investor. S&P 500 Software & Services Index telah turun sekitar 26% sejak awal 2026, dan kekhawatiran struktural terhadap SaaS konvensional terus membebani seluruh sektor.

Analisis Sudut Pandang Berbagai Media

VentureBeat: "Claude Opus 4.7 merebut kembali posisi LLM terkuat yang tersedia untuk publik dengan selisih tipis" — menilai secara eksplisit keunggulan teknis
Axios: "Mengakui tidak mampu menyamai Mythos yang belum dirilis" — menekankan pesan pengendalian diri Anthropic
CNBC: "Model AI dengan risiko lebih rendah dibanding Mythos" — menempatkan keseimbangan keamanan × komersial sebagai fokus utama pemberitaan
Gizmodo: "Merilis Opus 4.7 untuk mengingatkan semua orang betapa hebatnya Mythos" — ulasan bernada sindiran
TheNextWeb: "Melampaui GPT-5.4 dan Gemini 3.1 Pro dalam SWE-bench dan penalaran agen" — menekankan keunggulan benchmark
The Decoder: "Lompatan besar dalam coding dan pengurangan kemampuan siber yang disengaja" — perspektif keamanan
Help Net Security: "Dilengkapi pengaman keamanan siber otomatis" — penjelasan praktis untuk industri keamanan
LessWrong: "Opus 4.7 mungkin hanya batu loncatan untuk menonjolkan kehadiran Mythos" — pengamatan tajam dari komunitas keamanan AI
9to5Mac: "Fokus pada rekayasa perangkat lunak tingkat lanjut" — perspektif ekosistem Apple
TechCrunch: "Anthropic menahan tawaran valuasi $800 miliar+ dari VC" — konteks pendanaan
Bloomberg: "Menarik tawaran investor dengan valuasi $800 miliar" — perspektif investor
PYMNTS.com: "Alat desain Anthropic mendekati Adobe dan Figma" — perspektif media keuangan

Secara keseluruhan, media teknologi spesialis menilai positif peningkatan teknis, namun tetap menyoroti positioning yang membatasi diri sebagai "tidak mampu menyamai Mythos". Media keuangan dan investasi cenderung berfokus pada valuasi $800 miliar dan prospek IPO, serta membahas skenario transformasi struktural menuju "perusahaan AI full-stack" ala Silicon Valley.

Pendapat Jujur Para Engineer yang Diamati di Hacker News

Dalam thread Hacker News 47793411, poin-poin berikut sedang aktif diperdebatkan di komunitas teknisi.

1. Ketidaktransparanan Adaptive Thinking: Terdapat beberapa laporan bahwa sistem "tidak berpikir saat seharusnya berpikir". Ketidakpuasan terhadap fakta bahwa "Extended Thinking tidak lagi dapat dinonaktifkan" terus berlanjut.

2. Disembunyikannya Konten Pemikiran: Kritik muncul: "Mengapa chain-of-thought disembunyikan padahal saya menggunakan API? Bukankah ini bertentangan dengan komitmen transparansi awal Anthropic?"

3. Berbagi Solusi Alternatif: Tips seperti "display": "summarized", CLAUDE_CODE_DISABLE_1M_CONTEXT=1, dan /effort xhigh telah diposting, dan pengetahuan yang tidak tercantum dalam dokumentasi resmi pun dibagikan di komunitas.

4. Laporan Kegagalan Logika: Kasus kegagalan konkret seperti "disarankan untuk berjalan kaki ke fasilitas cuci mobil" turut dibagikan, dan kekhawatiran terhadap "kesenjangan antara skor benchmark dan pengalaman di lapangan" pun diungkapkan.

5. Teori Langkah Pencegahan Distilasi Kompetitor: Spekulasi bahwa "penyembunyian penalaran adalah pertahanan kekayaan intelektual untuk mencegah distilasi oleh model kompetitor" mendapat dukungan kuat.

Peta Jalan ke Depan——Kapan dan Apa yang Akan Bergerak

Berdasarkan pengumuman resmi Anthropic dan berbagai laporan, berikut adalah ringkasan tonggak pencapaian utama yang akan datang.

Jangka Pendek (April–Mei 2026)

30 April: Berakhirnya harga promosi 7,5× untuk GitHub Copilot. Setelah itu kemungkinan akan berlaku harga penalti atau penetapan harga ulang
Awal Mei: Task Budgets kemungkinan akan beralih dari beta publik ke ketersediaan umum (ada indikasi dari karyawan Anthropic)
Dalam Mei: Batch persetujuan awal Program Cyber Verification mulai didistribusikan
Mei: Kickoff resmi Project Glasswing, peluncuran penuh kemitraan Mythos Preview

Jangka Menengah (Juni–September 2026)

Juni~: Rilis Sonnet 4.8 (nama kode yang dikonfirmasi melalui kebocoran npm). Diharapkan sebagai versi cost-performance dari Opus 4.7
Juli~: Peluncuran penuh Claude Managed Agents berbasis Opus 4.7 dan pengungkapan rekam jejak pelanggan enterprise
Akhir Agustus: Kemungkinan pengajuan S-1 Anthropic

Jangka Panjang (Oktober 2026 dan Seterusnya)

Oktober: IPO Anthropic di NASDAQ (Goldman Sachs, JPMorgan, dan Morgan Stanley sebagai kandidat penjamin emisi utama)
Q4: Pengumuman riset menuju Opus 4.8 atau Opus 5.0 (kemungkinan porting sebagian kemampuan Mythos Preview ke model yang tersedia untuk umum)

Garis waktu visi "negara jenius di dalam pusat data" yang berulang kali disampaikan oleh CEO Dario Amodei adalah tahun 2026–2027. Opus 4.7 diposisikan sebagai "flagship komersial" yang berperan sebagai jembatan menuju Mythos.

Kesimpulan——Opus 4.7 adalah revisi besar yang menyamar sebagai "versi minor"

Claude Opus 4.7, meski menampilkan kesan "minor" dengan kenaikan nomor versi 0.1, pada kenyataannya mengandung perubahan yang sangat besar dari sudut pandang rekayasa perangkat lunak: pemutusan kompatibilitas API, perubahan tokenizer, pembaruan arsitektur inferensi (pemaksaan Adaptive Thinking), peningkatan kemampuan visi hingga 3×, level inferensi baru xhigh, serta parameter baru task_budget.

Bagi engineer teknologi di Silicon Valley, rilis ini menghadirkan tiga tantangan utama:

1. Biaya migrasi: Pemutusan kompatibilitas API mengharuskan refactoring pada codebase yang sudah ada. Khususnya penghapusan ketergantungan pada temperature dan top_p, eliminasi Extended Thinking, serta pengaktifan tampilan pemikiran secara opt-in.

2. Evaluasi ulang biaya: Perlu perancangan ulang prompt cache dan penggunaan gabungan dengan Sonnet, dengan mempertimbangkan "kenaikan biaya tersembunyi" berupa tokenizer 1,35× lebih besar dan GitHub Copilot multiplier 7,5×.

3. Penyetelan ulang prompt: Eksplisitasi yang disesuaikan dengan "pengikutan instruksi yang lebih harfiah", penghapusan scaffolding lama, serta perancangan prompt dengan asumsi default xhigh.

Di sisi lain, data kuantitatif dari mitra adopsi awal seperti CodeRabbit, Warp, Cursor, Box, Notion, dan Rakuten membuktikan bahwa Opus 4.7 bukan sekadar peningkatan skor semata, melainkan salah satu dari sedikit upgrade model yang mampu secara bersamaan mencapai peningkatan kualitas nyata, pengurangan biaya, dan peningkatan pengalaman developer dalam alur kerja produksi.

Ada pandangan bahwa "Opus 4.7 adalah batu loncatan menuju Mythos", namun dalam keseharian rekayasa perangkat lunak di Silicon Valley, model ini akan menjadi flagship utama untuk sementara waktu ke depan. Pertanyaannya bukan "apakah akan digunakan atau tidak", melainkan "kapan, bagaimana, dan dengan perancangan ulang seperti apa model ini akan diintegrasikan ke dalam produksi" — kualitas keputusan itulah yang akan menentukan daya saing produk berbasis AI native pada paruh kedua tahun 2026.