iPhone 17 Pro Gila, Jalankan AI Raksasa 400 Miliar Parameter, Canggih Tapi Super Lambat
iPhone 17 Pro gila karena disebut-sebut mampu menjalankan model AI berukuran sangat besar, mencapai 400 miliar parameter, langsung di dalam perangkat.--
KORANRADARKAUR.ID - Perkembangan teknologi kecerdasan buatan kembali menghadirkan kejutan yang sulit dipercaya. Kali ini, iPhone 17 Pro gila karena disebut-sebut mampu menjalankan model AI berukuran sangat besar, mencapai 400 miliar parameter, langsung di dalam perangkat.
Angka tersebut bukan sekadar besar, tetapi masuk kategori ekstrem, bahkan untuk standar komputasi kelas server sekalipun.
Temuan ini langsung memicu perhatian luas di kalangan pengembang dan pengamat teknologi. Pasalnya, model AI dengan skala raksasa seperti itu umumnya membutuhkan sumber daya luar biasa besar, termasuk kapasitas memori hingga ratusan gigabita hanya untuk sekadar memuat model ke dalam sistem.
Sementara itu, perangkat seperti iPhone 17 Pro secara umum hanya dibekali RAM sekitar 12GB, jauh di bawah kebutuhan ideal model sebesar itu.
Lantas, bagaimana mungkin perangkat genggam bisa menjalankan model AI yang biasanya hanya hidup di pusat data?
Jawabannya terletak pada pendekatan teknis yang tidak biasa. Berdasarkan demonstrasi yang beredar, iPhone 17 Pro tidak benar-benar memuat seluruh model ke dalam RAM sekaligus.
Sebaliknya, sistem bekerja secara dinamis dengan mengambil bagian-bagian tertentu dari model langsung dari penyimpanan internal saat dibutuhkan.
Metode ini menjadi mungkin berkat penerapan arsitektur yang dikenal sebagai Mixture of Experts (MoE). Dalam konsep ini, model AI tidak bekerja sebagai satu kesatuan besar yang aktif sepenuhnya, melainkan terbagi menjadi sejumlah pakar atau sub-model.
Saat proses berjalan, hanya sebagian kecil dari komponen tersebut yang diaktifkan, sementara sisanya tetap tidak digunakan.
BACA JUGA:Android Mirip iPhone 17 Pro Max, Harga Murah Mulai Rp 1 Jutaan, Ini 5 HP Android yang Layak Dilirik
BACA JUGA:Ini HP Android dengan Desain Mirip iPhone 17 Pro Max, Harga Lebih Terjangkau
Pendekatan ini secara signifikan menekan kebutuhan memori aktif, sehingga perangkat dengan spesifikasi terbatas sekalipun tetap bisa menjalankan model berukuran masif. Namun, solusi ini bukan tanpa konsekuensi.
Demonstrasi yang dibagikan oleh pengembang dengan nama akun @anemll melalui proyek open-source Flash-MoE menunjukkan bahwa meskipun secara teknis memungkinkan, performa yang dihasilkan masih jauh dari kata ideal. Dalam pengujian tersebut, kecepatan model hanya mencapai sekitar 0,6 token per detik.
Bagi pengguna awam, angka ini mungkin terdengar abstrak. Namun dalam praktiknya, kecepatan tersebut berarti satu kata saja bisa membutuhkan waktu beberapa detik untuk muncul di layar.