Penyelidik MIT Memperkenalkan Teknik Yang Meningkatkan Kemahiran Penaakulan Model Bahasa AI

Penyelidik dari MIT telah memperkenalkan Natural Language Embedded Programs (NLEPs), satu teknik yang meningkatkan kebolehan penaakulan model bahasa yang besar. Kejayaan ini menggabungkan pengaturcaraan dan bahasa semula jadi, mencapai ketepatan lebih 90% dalam pelbagai tugas, dan menawarkan lebih ketelusan dan kebolehpercayaan dalam sistem AI.

Model bahasa yang besar, seperti yang memperkasakan ChatGPT, telah menunjukkan keupayaan yang mengagumkan seperti merangka taklimat undang-undang, menganalisis sentimen pelanggan dan menterjemah dokumen. Namun, model ini sering tersandung apabila menangani tugas yang memerlukan penaakulan berangka atau simbolik yang rumit.

Masukkan Program Terbenam Bahasa Asli (NLEP), teknik revolusioner yang dicadangkan oleh penyelidik dari MIT dan institusi lain. Kaedah ini menggesa model bahasa untuk menjana dan melaksanakan program Python untuk menyelesaikan pertanyaan yang kompleks, dan kemudian untuk menyatakan penyelesaian dalam bahasa biasa. Pendekatan ini secara drastik meningkatkan ketepatan model pada pelbagai tugas penaakulan, menjadikan proses lebih telus dan serba boleh.

“Kami mahu AI melakukan penaakulan kompleks dengan cara yang telus dan boleh dipercayai. Masih jauh lagi untuk dilalui, tetapi kami telah menunjukkan bahawa menggabungkan keupayaan pengaturcaraan dan bahasa semula jadi dalam model bahasa besar merupakan langkah pertama yang berpotensi sangat baik ke arah masa depan di mana orang ramai boleh memahami dan mempercayai sepenuhnya perkara yang berlaku dalam AI mereka model,” Hongyin Luo, rakan sekutu pasca doktoral di MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) dan pengarang utama bersama mengkaji, berkata dalam a kenyataan.

NLEP beroperasi dengan meminta model mengikut proses berstruktur. Model ini mula-mula memanggil fungsi yang diperlukan, mengimport data bahasa semula jadi yang berkaitan (seperti senarai hari lahir presiden AS), melakukan pengiraan melalui fungsi dan, akhirnya, membentangkan hasil dalam bahasa semula jadi. Pendekatan empat langkah berstruktur ini memastikan kebolehpercayaan yang lebih tinggi dan menjadikan penyelesaian masalah menjadi mudah, kerana pengguna boleh memeriksa dan membetulkan kod Python secara langsung jika ralat berlaku.

"Ia seperti kalkulator digital yang sentiasa memberikan anda hasil pengiraan yang betul selagi program itu betul," tambah Luo.

Pasukan itu menguji NLEP dalam pelbagai tugas, termasuk penaakulan simbolik, mengikut arahan dan klasifikasi teks, mencapai ketepatan lebih 90%. Hebatnya, NLEP berprestasi 30% lebih baik daripada kaedah dorongan khusus tugas lain, walaupun menggunakan model sumber terbuka yang kurang canggih.

Di samping meningkatkan ketepatan, NLEP menawarkan faedah dari segi privasi dan kecekapan data. Memandangkan program dijalankan secara setempat, data pengguna tidak perlu dihantar ke entiti luaran seperti OpenAI atau Google untuk diproses. Selain itu, dengan menjana satu program teras untuk soalan yang serupa, pengguna boleh menggantikan pembolehubah tanpa menjalankan semula model, menjimatkan sumber pengiraan yang ketara.

"Memiliki alasan model bahasa dengan kod membuka banyak peluang untuk penggunaan alat, pengesahan output, pemahaman yang lebih berstruktur ke dalam keupayaan dan cara pemikiran model, dan banyak lagi," kata Leonid Karlinsky, saintis utama di MIT-IBM Watson AI Lab.

Walau bagaimanapun, salah satu batasannya ialah model yang lebih kecil mungkin tidak menunjukkan prestasi yang baik dengan NLEP kerana data latihan terhad mereka. Oleh itu, para penyelidik berminat untuk meneroka cara meningkatkan keupayaan model bahasa yang lebih kecil dan meningkatkan keteguhan variasi segera.

“Tiada keajaiban di sini. Kami tidak mempunyai model bahasa yang lebih mahal atau mewah. Apa yang kami lakukan ialah menggunakan penjanaan program dan bukannya penjanaan bahasa semula jadi, dan kami boleh menjadikannya berprestasi dengan lebih baik,” kata Luo.

Penyelidikan ini, yang menjanjikan masa depan yang telus dan cekap untuk AI, akan dibentangkan pada Persidangan Tahunan Persatuan Linguistik Pengiraan Amerika Utara Bab. Ia menandakan satu langkah penting ke arah membina sistem AI yang berkuasa dan mudah difahami oleh manusia.