Terbongkar! hasil riset ungkap borok Grokipedia besutan Elon Musk

Melakukan perbandingan skala penuh, para peneliti menggunakan kerangka kerja metodologis yang canggih.

author photo
A- A+
Terbongkar! hasil riset ungkap borok Grokipedia besutan Elon Musk
Elon Musk | cover: topik.id

Elon Musk meluncurkan Grokipedia pada 27 Oktober 2025, memposisikannya sebagai alternatif ensiklopedia daring berbasis crowdsourced, Wikipedia. Peluncuran ini didorong oleh kritik Musk sebelumnya terhadap Wikipedia, yang ia cap sebagai "perpanjangan dari propaganda media lama," dengan janji bahwa Grokipedia akan berpegang teguh pada "kebenaran, seluruh kebenaran, dan hanya kebenaran." 

Namun, sebuah riset mengungkapkan latar belakang ideologis itu berbeda jauh, penelitian komprehensif pertama ini yang dilakukan oleh periset Harold Triedman dan Alexios Mantzarlis, yang bertujuan untuk membandingkan secara langsung 883.858 entri Grokipedia, hampir seluruh korpus yang tersedia dengan padanannya di Wikipedia untuk menentukan apakah produk Musk hanyalah "turunan sintetis" atau memiliki agenda editorial yang berbeda.

Untuk melakukan perbandingan skala penuh ini, para peneliti menggunakan kerangka kerja metodologis yang canggih. Mereka mengikis (scraping) Grokipedia dan membandingkan kontennya dengan dump Wikipedia bahasa Inggris. Untuk mengukur kesamaan tekstual secara mendalam, konten setiap artikel dipecah menjadi potongan-potongan (chunks) dan disematkan menggunakan model canggih EmbeddingGemma, lalu diukur kesamaan kosinusnya. 

Selain analisis tekstual, penelitian ini menggabungkan sumber data eksternal, termasuk statistik tampilan halaman WMF untuk menilai popularitas artikel dan dua set data terpisah untuk mengevaluasi keandalan domain sumber yang dikutip. Temuan kunci pertama berpusat pada tingkat kesamaan konten dan perbedaan lisensi di Grokipedia. 

Mayoritas artikel (56%) yang menampilkan lisensi Creative Commons (CC) Wikipedia menunjukkan tingkat kemiripan yang sangat tinggi, rata-rata mencapai 90%. Sebaliknya, artikel yang tidak berlisensi CC memiliki kesamaan yang secara signifikan lebih rendah, rata-rata 77%. 

"Rilis awal Grokipedia merupakan kisah tentang dua lisensi. Mayoritas konten Grokipedia (56% artikel hasil scraping) pada dasarnya merupakan turunan dari Wikipedia bahasa Inggris, yang mengadopsi lisensi Creative Commons (CC) milik Wikipedia. Artikel-artikel Grokipedia yang berlisensi CC, rata-rata, memiliki tingkat kemiripan 90% dengan artikel Wikipedia terkait," ungkap dalam laporan riset tersebut, seperti dilansir topik.id, Sabtu (15/11/2025). 

Terlepas dari lisensi, artikel Grokipedia secara konsisten jauh lebih panjang daripada padanannya di Wikipedia, dengan artikel non-CC median berlipat ganda hingga 4,6 kali lipat panjangnya. Menariknya, analisis tekstual mengungkap kasus transkripsi kata demi kata, termasuk adanya kesalahan ketik yang sama persis antara artikel Grokipedia dan Wikipedia, bahkan pada entri yang tidak berlisensi CC.

Meskipun Grokipedia dan Wikipedia berbagi 57 domain di antara 100 sumber yang paling banyak dikutip, menunjukkan landasan referensi yang umum, terjadi pergeseran komposisi sumber yang mencolok. Grokipedia menunjukkan ketergantungan yang lebih besar pada sumber akademis (19 di top 100) dan konten buatan pengguna (UGC) seperti X/Twitter, Reddit, dan Facebook (9 di top 100), sementara Wikipedia relatif lebih mengandalkan outlet media arus utama (40 di top 100). 

"Sisa konten Grokipedia (menurut Ketentuan Layanan xAI November 2025 ) dilisensikan dengan cara yang sama seperti keluaran chatbot Grok. Artikel-artikel yang tidak berlisensi CC ini secara signifikan kurang mirip dengan artikel Wikipedia bahasa Inggris terkait (tingkat kemiripan 77%)," jelas dalam laporan itu.

Grokipedia mengutip domain Wikimedia. 

Komposisi jenis domain dari 100 sumber yang paling banyak dikutip di Wikipedia dan Grokipedia sangat berbeda; Grokipedia mengutip lebih banyak sumber akademis dan UGC | dok: https://arxiv.org/html/2511.09685v1

Namun, yang sangat menonjol adalah minimnya atribusi Grokipedia hanya mengutip domain Wikimedia Foundation sekitar 445 kali, atau 1 dari 100.000 kutipan, meskipun lebih dari separuh kontennya diadaptasi dari Wikipedia. Perbedaan yang paling mengkhawatirkan muncul dalam praktik sitasi dan kualitas sumber.

Dengan menggunakan daftar Sumber Abadi Wikipedia, Grokipedia ditemukan mengutip sumber yang "umumnya andal" dalam proporsi yang jauh lebih rendah (penurunan relatif 39%) dan secara tidak proporsional meningkatkan penggunaan sumber yang "umumnya tidak andal" (peningkatan relatif 86%) dan sumber yang "masuk daftar hitam" (peningkatan relatif 275%).

Secara khusus, 5,5% artikel Grokipedia mencantumkan setidaknya satu sumber yang "masuk daftar hitam," peningkatan sembilan kali lipat dibandingkan Wikipedia, yang mengindikasikan ketidakselarasan yang signifikan dengan norma editorial Wikipedia. Penyelidikan lebih lanjut menggunakan skor keandalan domain eksternal mengkonfirmasi temuan ini.

Grokipedia tiga kali lebih mungkin mengutip domain yang dinilai memiliki kredibilitas sangat rendah (skor 0,0 hingga 0,2) dibandingkan Wikipedia. Yang paling ekstrem, Grokipedia memuat 42 sitasi ke situs web neo-Nazi Stormfront dan 34 sitasi ke situs konspirasi InfoWars, sementara kedua situs ini tidak dikutip sama sekali di Wikipedia bahasa Inggris. 

"Praktik sitasi Grokipedia tampaknya kurang sejalan dengan norma editorial Wikipedia. Sumber yang "umumnya tepercaya" mencapai 7,7% sitasi di Grokipedia (penurunan relatif sebesar 39%), sumber yang "umumnya tidak tepercaya" mencapai 5,4% sitasi (peningkatan relatif sebesar 86%), dan sumber yang "masuk daftar hitam" mencapai 0,1% sitasi (peningkatan relatif sebesar 275%). Pada tingkat artikel, peningkatan ini bahkan lebih drastis: 5,5% artikel Grokipedia memuat setidaknya satu sitasi dari sumber yang "masuk daftar hitam"—peningkatan sembilan kali lipat dibandingkan Wikipedia," ungkap kembali dari lapaoran itu.

Temuan lain yang patut dicatat adalah apa yang disebut "auto-sitogenesis LLM," di mana Grokipedia menyertakan 1.050 sitasi ke tautan percakapan bot Grok yang dibagikan secara publik di X/Twitter, yang secara efektif menggunakan keluaran modelnya sendiri sebagai sumber otoritatif. Analisis subkumpulan artikel sensitif, termasuk biografi pejabat terpilih dan topik kontroversial, menunjukkan kesamaan yang lebih rendah dan bias yang lebih jelas. 

"Di antara ratusan sitasi ke akun @grok X/Twitter dan sekitar seribu tautan ke percakapan Grok, Grokipedia mungkin terlibat dalam jenis baru "auto-sitogenesis LLM" 6 : pembuatan teks LLM yang diarahkan pengguna di situs pihak ketiga, yang kemudian digunakan oleh LLM yang sama (atau LLM dalam keluarga model yang sama) untuk menulis sumber daya ensiklopedis. Analisis komposisi sitasi di kedua situs ini baru menyentuh permukaan. Kami yakin masih banyak pekerjaan yang harus diselesaikan di bidang ini di masa mendatang," beber dalam laporan tersebut.

Share:
Premium.
Komentar
Komentar sepenuhnya tanggung jawab pengguna dan diatur dalam UU ITE.

Update
Indeks