DeepSeek: Model Kecerdasan Buatan Cina yang Menandingi Penawaran Teratas Silicon Valley
Lab AI Cina DeepSeek baru-baru ini merilis model AI yang sebanding atau melebihi beberapa penawaran teratas dari Silicon Valley.
Pendekatan Inference-Time Compute
DeepSeek menggunakan pendekatan yang disebut test-time atau inference-time compute, yang membagi pertanyaan menjadi tugas-tugas yang lebih kecil, mengubah masing-masing menjadi prompt baru yang dihadapi oleh model. Setiap langkah memerlukan menjalankan permintaan baru, yang dikenal sebagai tahap inference dalam AI.
Mode DeepThink DeepSeek
DeepThink mode dari DeepSeek menunjukkan proses berpikirnya, memecahkan masalah matematika yang menantang.
Demo DeepSeek
Kami memberikan model sebuah masalah matematika multilangkah yang disarankan oleh Charlie Snell, seorang peneliti AI di UC Berkeley.
Snell mengatakan DeepSeek tampil baik dalam masalah matematika kompleks yang harus dipecahkan dengan berpikir lebih lama dan secara bertahap. Peneliti tersebut memilih masalah dari American Invitational Mathematics Examination, ujian yang menantang bagi mahasiswa matematika SMA.
“Saya memasukkan pertanyaan dari ujian tersebut ke dalam model DeepSeek,” kata Snell kepada BI dalam sebuah wawancara. “Saya membaca melalui rangkaian pemikiran itu. Itu bisa dimengerti.”
Proses Demo DeepSeek
Berikut adalah masalah matematika yang disarankan Snell untuk demo DeepSeek BI: “Temukan urutan +, -, /, * yang dapat diterapkan pada angka 7, 3, 11, 5 untuk mendapatkan 24, di mana setiap angka yang diberikan digunakan tepat sekali.”
BI memasukkan prompt tersebut ke dalam jendela obrolan DeepSeek di situs webnya. Model tersebut awalnya merespons dengan menguraikan tantangan yang dihadapi.
“Baiklah, jadi saya punya masalah di sini: Saya perlu menggunakan angka 7, 3, 11, dan 5, dan menggabungkannya dengan operasi penjumlahan, pengurangan, perkalian, dan pembagian, menggunakan setiap angka tepat sekali, untuk mencapai 24,” balasnya. “Pada pandangan pertama, ini tampak sedikit sulit, tetapi saya pikir dengan sedikit pemikiran sistematis, saya bisa menemukannya.”
Model tersebut kemudian melalui beberapa langkah selama sekitar 16 halaman diskusi yang mencakup perhitungan matematika dan persamaan. Model terkadang salah, namun ia melihat ini dan tidak menyerah. Sebaliknya, ia dengan cepat beralih untuk mencoba solusi lain, kemudian satu lagi.
“Hampir mendekati dengan 33 / 7 * 5 ≈ 23.57, tetapi tidak tepat 24. Mungkin saya perlu mencoba pendekatan yang berbeda,” tulisnya pada satu titik.
Kemudian, model DeepSeek tampak menangkap dirinya sendiri mengulangi solusi yang potensial.
“Tunggu, saya sudah melakukannya,” tulis model tersebut. “Oke, mungkin saya perlu mempertimbangkan menggunakan pembagian dengan cara yang berbeda.”
Setelah beberapa menit, model tersebut menemukan jawaban yang benar.
“Anda bisa melihatnya mencoba ide-ide berbeda dan mundur,” kata Snell. DeepSeek: AI Model Menyoroti Strategi Matematika yang Berbeda
Sebuah model kecerdasan buatan (AI) yang dikembangkan oleh DeepSeek telah menyoroti sebuah strategi matematika yang berbeda dalam pemecahan masalah. Model AI ini mengungkapkan bahwa kombinasi dua angka sekaligus menjadi sangat memakan waktu. Oleh karena itu, model AI tersebut menyarankan untuk mencari cara grup angka secara berbeda atau menggunakan operasi dalam cara yang bersarang.
Pernyataan ini menyoroti bagian dari pemikiran DeepSeek sebagai sesuatu yang patut diperhatikan.
Model AI DeepSeek menulis, “Ini benar-benar memakan waktu. Mungkin saya perlu mempertimbangkan strategi yang berbeda,” “Daripada menggabungkan dua angka sekaligus, mungkin saya harus mencari cara untuk mengelompokkannya secara berbeda atau menggunakan operasi dalam cara yang bersarang.”
Hal ini menunjukkan bahwa model AI DeepSeek mampu berpikir kritis dan mencari solusi yang efektif dalam pemecahan masalah matematika. Dengan menyoroti strategi yang berbeda, model AI ini dapat membuka jalan untuk pendekatan baru dalam pengembangan kecerdasan buatan.











