DeepSeek China Tunjukkan Pengembangan AI yang Cepat, Teknologi Amerika Tersaingi


Startup AI China Menunjukkan Kemajuan yang Mengkhawatirkan bagi Laboratorium AI Teratas Amerika

Startup AI China, DeepSeek, baru saja merilis model AI baru yang tampaknya menyaingi OpenAI’s o1 pada hari Senin lalu. Kemampuan penalarannya telah membuat tercengang para peneliti AI Amerika terkemuka.

Peringatan dari Tim AI China untuk Donald Trump

Donald Trump memulai kepresidenan barunya dengan menyatakan bahwa Amerika harus memimpin dunia. Namun, ia baru saja mendapat tembakan peringatan dari tim AI hebat di China yang siap menunjukkan bahwa supremasi teknologi AS tidaklah pasti.

DeepSeek: Startup China yang Mengejar Ketinggalan

Bertemu dengan DeepSeek, sebuah startup China yang berasal dari hedge fund yang sudah berusia sepuluh tahun dan menghitung perdagangan cerdas dengan AI dan algoritma. Rilis terbarunya, yang keluar saat Trump diangkat menjadi presiden, telah membuat banyak peneliti industri teratas Amerika tercengang.

DeepSeek Mempersempit Kesenjangan

Apa yang sebenarnya dilakukan oleh R1? Pertama-tama, DeepSeek mengatakan bahwa R1 mencapai “kinerja yang sebanding dengan OpenAI o1 dalam tugas matematika, kode, dan penalaran.” Menurut paper penelitiannya, ini dimungkinkan berkat “pembelajaran penguatan murni,” sebuah teknik yang Jim Fan, seorang manajer penelitian senior di Nvidia, katakan mirip dengan rahasia di balik membuat AlphaZero Google DeepMind menjadi ahli dalam permainan seperti go dan catur dari awal, “tanpa meniru gerakan master catur manusia terlebih dahulu.” Dia menulis di X bahwa ini adalah “hal terpenting yang bisa dipetik dari paper tersebut.”

DeepSeek, yang diluncurkan pada tahun 2023, mengatakan dalam papernya bahwa mereka melakukannya karena tujuan mereka adalah untuk mengeksplorasi potensi AI untuk “mengembangkan kemampuan penalaran tanpa data yang dipantau.” Ini adalah teknik umum yang digunakan oleh peneliti AI.

Perusahaan DeepSeek telah mengumumkan bahwa versi sebelumnya dari R1 yang disebut R1-Zero memberi mereka “moments of enlightenment” di mana kecerdasan buatan “belajar untuk mengalokasikan lebih banyak waktu berpikir untuk menyelesaikan masalah dengan mengevaluasi pendekatan awalnya.”

R1: Kecerdasan Buatan yang Transparan

Hasil akhir menawarkan apa yang profesor Wharton, Ethan Mollick, deskripsikan sebagai tanggapan dari R1 yang terdengar “seperti manusia berpikir secara terbuka.” Secara signifikan, tingkat transparansi ini dalam pengembangan kecerdasan buatan sulit ditemukan dalam catatan yang diterbitkan oleh perusahaan seperti OpenAI ketika merilis model-model dengan kemampuan serupa.

Nathan Lambert, seorang ilmuwan penelitian di Allen Institute for AI, menyatakan di Substack bahwa makalah R1 adalah “titik transisi utama dalam penelitian model penalaran yang tidak pasti” karena “sampai saat ini, model penalaran telah menjadi area penelitian industri utama tanpa makalah seminal yang jelas.”

R1: Model yang Dibuka

Dengan tetap setia pada semangat terbuka, model R1 dari DeepSeek, secara kritis, telah sepenuhnya dibuka untuk umum, dengan lisensi MIT yang diperolehnya — standar industri untuk lisensi perangkat lunak. Bersama-sama, elemen-elemen R1 ini menimbulkan komplikasi bagi pemain dari Amerika Serikat yang terlibat dalam perlombaan senjata kecerdasan buatan dengan China — rival geopolitik utama Trump — karena beberapa alasan.

Pertama, ini menunjukkan bahwa China dapat menyaingi beberapa model kecerdasan buatan teratas di industri dan tetap sejalan dengan perkembangan terbaru yang keluar dari Silicon Valley.

Kedua, membuka AI yang sangat canggih juga dapat menantang perusahaan yang berusaha untuk mendapatkan keuntungan besar dengan menjual teknologi mereka. Sebagai contoh, OpenAI memperkenalkan rencana ChatGPT Pro pada bulan Desember dengan biaya $200 per bulan. Salah satu titik penjualannya adalah bahwa itu termasuk “akses tanpa batas” ke model terpintar mereka saat itu, o1. Jika model sumber terbuka menawarkan kemampuan serupa secara gratis, insentif untuk membeli langganan berbayar yang mahal bisa berkurang.

Fan dari Nvidia menggambarkan situasi ini seperti ini di X: “Kita hidup dalam garis waktu di mana perusahaan non-AS menjaga misi asli OpenAI tetap hidup — penelitian terbuka, canggih yang memberdayakan semua.”

DeepSeek telah menunjukkan keahlian penalaran sebelumnya. Pemodelan Baru “V3” Dirilis oleh DeepSeek, Membawa Perbaikan Berarti Menurut Peneliti Amerika

Pada bulan November, perusahaan merilis “R1-lite-preview” yang menunjukkan “proses pemikiran transparan secara real-time.” Pada bulan Desember, mereka merilis model yang disebut V3 untuk menjadi fondasi baru yang lebih besar bagi pemodelan di masa depan.

Menurut para peneliti Amerika, ini adalah alasan utama mereka melihat peningkatan bermakna dalam model terbaru, yaitu R1.

Theo Browne, seorang pengembang perangkat lunak di balik saluran YouTube populer untuk komunitas teknologi, mengatakan bahwa “model baru DeepSeek R1 luar biasa.” Tanay Jaipuria, seorang mitra yang berinvestasi di bidang kecerdasan buatan di Wing VC Silicon Valley, juga menggambarkannya sebagai “luar biasa.”

Keunggulan Model R1 dalam Pemrosesan AI

Awni Hannun, seorang peneliti pembelajaran mesin di Apple, mengatakan bahwa keunggulan utama dari R1 adalah bahwa ia membutuhkan lebih sedikit intensitas, menunjukkan bahwa industri ini “semakin mendekati o1 open-source, di rumah, pada perangkat konsumen,” merujuk pada model pemikiran OpenAI yang diperkenalkan tahun lalu.

Model ini dapat “distilasi,” yang berarti versi yang lebih kecil namun juga kuat dapat berjalan pada perangkat keras yang jauh lebih sedikit intensif dibandingkan dengan daya komputasi yang dimuat ke dalam server di pusat data yang banyak perusahaan teknologi andalkan untuk menjalankan model AI mereka.

Tantangan Censorship dalam AI

Namun, R1 tampaknya memiliki satu masalah kunci. Mantan anggota dewan OpenAI, Helen Toner, menunjukkan bahwa ada demo R1 “menonaktifkan diri sendiri ketika ditanyai tentang topik yang tidak disukai oleh CCP.”

Toner menyarankan bahwa “sensor ini jelas dilakukan oleh lapisan di atas, bukan oleh model itu sendiri.” DeepSeek tidak langsung menanggapi permintaan komentar.

Menilik Prestasi DeepSeek

Diberikan catatan kinerja DeepSeek sejauh ini, jangan heran jika model berikutnya menunjukkan kesetaraan dengan o3.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *