09:44
Karyawan OpenAI secara terbuka menuduh hasil uji coba Benchmark dari model AI terbaru xAI Grok3 memiliki sifat yang menyesatkan
Karyawan OpenAI menuduh hasil pengujian benchmark model kecerdasan buatan Grok3 yang dirilis xAI menyesatkan, namun xAI menyangkal perilaku yang tidak pantas. Grok3 melampaui model terkuat OpenAI di AIME 2025, tetapi dikritik karena grafiknya tidak mencakup semua data perbandingan. Babushkin mengklaim bahwa OpenAI juga pernah merilis grafik serupa untuk membandingkan kinerja model.
- 1