Kenapa AI Tak Bisa Mengeja 'Strawberry'?

CNN Indonesia
Kamis, 29 Agu 2024 15:00 WIB
Meski tampak canggih, nyatanya AI memiliki keterbatasan yang signifikan, tidak bisa mengenali jumlah huruf "r" dalam kata "strawberry". Mengapa demikian?
Ilustrasi. Meski canggih, nyatanya AI tidak bisa mengeja kata
Jakarta, CNN Indonesia --

Meski tampak canggih, nyatanya AI memiliki keterbatasan yang signifikan. Salah satunya yaitu AI tidak bisa mengenali jumlah huruf "r" dalam kata "strawberry".

Lalu apa penyebab AI tak bisa mengeja 'strawberry'?

Model bahasa besar (LLM) dapat menulis esai dan memecahkan persamaan dalam hitungan detik. Mereka dapat mensintesiskan terabyte data lebih cepat daripada manusia dapat membuka buku.

ADVERTISEMENT

SCROLL TO CONTINUE WITH CONTENT

Namun, AI nampaknya membuat kegagalan besar hingga membuat banyak orang 'senang' dan ramai-ramai membuat meme yang viral.

Menurut produk AI seperti GPT-4o dan Claude, saat muncul pertanyaan; berapa kali huruf "r" muncul dalam kata "strawberry", maka jawabannya adalah dua kali. Jawaban tersebut sudah pasti salah karena jawaban yang benar adalah ada tiga huruf "r" dalam kata strawberry.

Mengapa demikian?

Kegagalan model bahasa yang besar untuk memahami konsep huruf dan suku kata merupakan indikasi kebenaran yang lebih besar yang sering kita lupakan: Benda-benda ini tidak punya otak.

Mereka tidak berpikir seperti manusia. Mereka bukan manusia, bahkan tidak mirip manusia.

Sebagian besar LLM dibangun di atas transformer, semacam arsitektur pembelajaran mendalam. Model transformer memecah teks menjadi token, yang dapat berupa kata-kata lengkap, suku kata, atau huruf, tergantung pada modelnya.

"LLM didasarkan pada arsitektur transformer ini, yang secara khusus tidak benar-benar membaca teks. Apa yang terjadi ketika Anda memasukkan perintah adalah perintah tersebut diterjemahkan ke dalam sebuah enkode," kata Matthew Guzdial, seorang peneliti AI dan asisten profesor di University of Alberta, kepada TechCrunch.

"Ketika melihat kata 'the,' ia memiliki satu enkode tentang apa arti 'the', tetapi tidak mengetahui tentang 'T,' 'H,' 'E.'"

Hal ini karena transformer tidak dapat menerima atau mengeluarkan teks yang sebenarnya secara efisien.

Sebaliknya, teks tersebut diubah menjadi representasi numerik dari dirinya sendiri, yang kemudian dikontekstualisasikan untuk membantu AI menghasilkan respons yang logis.

Dengan kata lain, AI mungkin mengetahui bahwa token "straw" dan "berry" membentuk "strawberry," tetapi mungkin tidak memahami bahwa "strawberry" terdiri dari huruf "s," "t," "r," "a," "w," "b," "e," "r," "r," dan "y," dalam urutan tertentu.

Oleh karena itu, ia tidak dapat memberi tahu Anda berapa banyak huruf - apalagi berapa banyak huruf "r" - yang muncul dalam kata "strawberry."

Ini bukan masalah yang mudah untuk diperbaiki, karena masalah ini tertanam dalam arsitektur yang membuat LLM ini berfungsi.

Baca selengkapnya di halaman berikutnya...

Lebih sulit dari pelajari banyak bahasa

BACA HALAMAN BERIKUTNYA

HALAMAN:
1 2
LAINNYA DI DETIKNETWORK
LIVE REPORT
TERPOPULER