Teknologi

Martin Hairer Ungkap Kelemahan ChatGPT-5.2 Pro dan Google Gemini dalam Menyelesaikan Riset Matematika Orisinal

Advertisement

Martin Hairer, peraih Fields Medal 2014, menegaskan bahwa kecerdasan buatan (AI) belum mampu menggantikan peran matematikawan profesional dalam menciptakan ide orisinal. Pernyataan ini didasarkan pada hasil eksperimen bertajuk “First Proof” yang menguji model AI tercanggih saat ini terhadap persoalan matematika yang belum pernah dipublikasikan.

Eksperimen First Proof Uji Model AI Tercanggih

Tim peneliti dari Harvard, Stanford, dan MathSci.ai merilis studi yang melibatkan ChatGPT-5.2 Pro dan Google Gemini 3.0 Deep Think. Eksperimen ini bertujuan memastikan AI tidak dapat mengambil jawaban dari data latihan di internet dengan menggunakan soal-soal riset murni yang orisinal.

Hasilnya menunjukkan bahwa AI masih memiliki keterbatasan besar dalam logika matematika tingkat tinggi. Martin Hairer bahkan menyamakan performa AI dengan mahasiswa sarjana yang kurang pintar karena cenderung bertele-tele pada bagian mudah namun minim detail pada argumen yang sulit.

Kelemahan Teknis dan Fenomena Infinite Loop

Para peneliti mengidentifikasi sejumlah faktor yang menyebabkan AI gagal dalam pembuktian matematika kompleks. Salah satunya adalah kelemahan dalam penalaran visual dan daya ingat yang menurun drastis jika pembuktian melebihi lima halaman.

Advertisement

  • Penalaran Visual: AI kesulitan menyelesaikan soal yang membutuhkan imajinasi ruang.
  • Daya Ingat Pendek: Kualitas jawaban menurun pada pembuktian panjang.
  • Kecenderungan Yes Man: AI hanya mengikuti sudut pandang pengguna tanpa kemampuan debat ilmiah.

Lauren Williams, profesor matematika dari Harvard, juga menemukan fenomena infinite loop. Dalam kondisi ini, AI terus-menerus mengoreksi jawabannya sendiri tanpa pernah mencapai solusi final yang benar saat menghadapi masalah riset sungguhan.

Dampak Terhadap Kemajuan Sains

Tamara Kolda dari MathSci.ai memperingatkan bahwa ketergantungan pada AI justru berpotensi memperlambat kemajuan sains. Hal ini dikarenakan AI hanya mengulang instruksi yang diberikan, berbeda dengan kolaborasi antarmanusia yang melibatkan perdebatan ide dan perspektif baru.

Informasi lengkap mengenai hasil riset ini disampaikan melalui laporan resmi tim peneliti yang dipublikasikan pada Selasa, 10 Februari 2026.

Advertisement