Teknologi

Profesor Martin Hairer Ungkap Kelemahan AI: Tak Mampu Cetuskan Ide Orisinal dalam Bidang Matematika

Advertisement

Martin Hairer, peraih Fields Medal 2014, bersama tim matematikawan elit dari Harvard dan Stanford melakukan eksperimen bertajuk “First Proof” untuk menguji kecerdasan buatan (AI). Eksperimen ini membuktikan bahwa model AI tercanggih saat ini masih gagal menyelesaikan soal-soal matematika riset yang orisinal.

Latar Belakang Eksperimen First Proof

Eksperimen ini bermula dari keresahan seorang siswa SMA yang mengirimkan surat elektronik kepada Hairer. Siswa tersebut mengkhawatirkan masa depannya di bidang matematika akan sirna karena kemampuan AI yang semakin canggih. Namun, Hairer menegaskan bahwa matematika masih relatif aman dari ancaman otomasi total.

Hairer mengakui bahwa Large Language Model (LLM) seperti ChatGPT sangat mahir menyelesaikan soal latihan standar yang sudah tersedia di internet. Namun, ia belum menemukan bukti bahwa AI mampu mencetuskan konsep matematika yang benar-benar baru.

“Saya belum melihat contoh yang masuk akal di mana LLM menghasilkan ide atau konsep baru yang benar-benar orisinal,” ujar Hairer.

Kegagalan AI dalam Menjawab Soal Riset

Dalam eksperimen “First Proof”, tim peneliti menguji model AI tercanggih, termasuk ChatGPT-5.2 Pro dan Google Gemini 3.0 Deep Think. Mereka menggunakan soal-soal riset yang belum pernah dipublikasikan untuk memastikan AI tidak dapat mengambil jawaban dari data latihan di internet.

Advertisement

Hasilnya, Hairer menyamakan kualitas jawaban AI dengan mahasiswa sarjana yang kurang kompeten. AI cenderung memberikan detail berlebihan pada bagian yang mudah, namun sangat minim penjelasan pada inti argumen yang sulit. AI seolah mengetahui titik awal dan tujuan akhir, tetapi gagal menyusun jalur pembuktian yang logis.

Kendala Utama Teknologi AI dalam Matematika

Tim peneliti mengidentifikasi beberapa alasan mengapa AI belum mampu menggantikan peran matematikawan profesional:

  • Kelemahan Visual: AI memiliki kemampuan penalaran visual yang buruk, sehingga gagal pada soal yang membutuhkan imajinasi ruang.
  • Daya Ingat Pendek: Kualitas jawaban menurun drastis jika pembuktian membutuhkan lebih dari lima halaman.
  • Sifat “Yes Man”: AI cenderung mengikuti sudut pandang pengguna dan tidak bisa diajak berdebat untuk menguji ide.
  • Fenomena Infinite Loop: Profesor Lauren Williams dari Harvard menemukan bahwa AI sering terjebak dalam lingkaran koreksi diri tanpa pernah mencapai solusi final yang benar.

Tamara Kolda dari MathSci.ai memperingatkan bahwa ketergantungan pada AI justru berpotensi memperlambat kemajuan sains karena ketiadaan perspektif baru yang menantang. Informasi lengkap mengenai riset ini telah dihimpun melalui laporan resmi yang dirilis pada Februari 2026.

Advertisement