Berita Apple

Penyelidik Apple Mendedahkan Sistem AI Baharu Yang Boleh Mengalahkan GPT-4

Penyelidik Apple telah membangunkan sistem kecerdasan buatan bernama ReALM (Resolusi Rujukan sebagai Pemodelan Bahasa) yang bertujuan untuk meningkatkan secara radikal cara pembantu suara memahami dan bertindak balas terhadap arahan.






Didalam kertas penyelidikan (melalui VentureBeat ), Apple menggariskan sistem baharu untuk cara model bahasa yang besar menangani resolusi rujukan, yang melibatkan pentafsiran rujukan samar-samar kepada entiti pada skrin, serta memahami konteks perbualan dan latar belakang. Akibatnya, ReALM boleh membawa kepada interaksi yang lebih intuitif dan semula jadi dengan peranti.

perbezaan antara iphone 6s dan iphone se

Penyelesaian rujukan ialah bahagian penting dalam pemahaman bahasa semula jadi, membolehkan pengguna menggunakan kata ganti nama dan rujukan tidak langsung lain dalam perbualan tanpa kekeliruan. Bagi pembantu digital, keupayaan ini secara historis menjadi cabaran yang ketara, terhad oleh keperluan untuk mentafsir pelbagai isyarat lisan dan maklumat visual. Sistem ReALM Apple berusaha untuk menangani perkara ini dengan menukar proses penyelesaian rujukan yang kompleks kepada masalah pemodelan bahasa tulen. Dengan berbuat demikian, ia boleh memahami rujukan kepada elemen visual yang dipaparkan pada skrin dan menyepadukan pemahaman ini ke dalam aliran perbualan.



ReALM membina semula reka letak visual skrin menggunakan perwakilan teks. Ini melibatkan menghuraikan entiti pada skrin dan lokasinya untuk menjana format teks yang menangkap kandungan dan struktur skrin. Penyelidik Apple mendapati bahawa strategi ini, digabungkan dengan penalaan halus khusus model bahasa untuk tugas resolusi rujukan, dengan ketara mengatasi kaedah tradisional, termasuk keupayaan GPT-4 OpenAI.

ReALM boleh membolehkan pengguna berinteraksi dengan pembantu digital dengan lebih cekap dengan merujuk kepada perkara yang sedang dipaparkan pada skrin mereka tanpa memerlukan arahan yang tepat dan terperinci. Ini berpotensi menjadikan pembantu suara lebih berguna dalam pelbagai tetapan, seperti membantu pemandu menavigasi sistem infotainmen semasa memandu atau membantu pengguna kurang upaya dengan menyediakan cara interaksi tidak langsung yang lebih mudah dan tepat.

bagaimana untuk memulakan aktiviti pada jam epal

Apple kini telah menerbitkan beberapa kertas penyelidikan AI. Bulan lepas, syarikat itu mendedahkan kaedah baru untuk melatih model bahasa besar yang mengintegrasikan kedua-dua maklumat teks dan visual dengan lancar. Apple dijangka akan memperkenalkan pelbagai ciri AI di WWDC pada bulan Jun.