پاسخهای ChatGPT Search در 57 درصد موارد کاملاً نادرست بود و تنها در 28 درصد مواقع به طور کامل صحیح پاسخ داد. با این حال، این ابزار تنها مدلی بود که به همه 200 جستجو پاسخ داد. در مقابل، Grok-3 از شرکت X (توییتر سابق) در 94 درصد موارد پاسخهای نادرست ارائه داد، و کوپایلوت مایکروسافت نیز از 200 جستجو، 104 مورد را بیپاسخ گذاشت.
تحقیقات جدید مرکز تاو برای روزنامهنگاری دیجیتال نشان میدهد که موتورهای جستجوی مبتنی بر هوش مصنوعی در 60 درصد مواقع نتایج نادرست ارائه میدهند. این تحقیق هشت موتور جستجوی AI، از جمله ChatGPT Search، پرپلکسیتی، جمینای، و گروک را ارزیابی کرده و مشخص کرده است که اغلب این ابزارها اطلاعات نادرست را با اطمینان بالا ارائه میدهند.
محققان 200 مقاله خبری از 20 رسانه مختلف را بررسی کردند و صحت پاسخهای AI را بر اساس استناد به مقاله، سازمان خبری، و URL آن سنجیدند. نتایج نشان داد که تنها پرپلکسیتی و پرپلکسیتی پرو عملکرد نسبتاً بهتری داشتند، در حالی که سایر موتورهای جستجو مانند ChatGPT Search و Grok-3 دقت بسیار پایینی داشتند.
ChatGPT Search در 57 درصد موارد کاملاً نادرست بود و تنها در 28 درصد مواقع به طور کامل صحیح پاسخ داد. با این حال، این ابزار تنها مدلی بود که به همه 200 جستجو پاسخ داد. در مقابل، Grok-3 از شرکت X (توییتر سابق) در 94 درصد موارد پاسخهای نادرست ارائه داد، و کوپایلوت مایکروسافت نیز از 200 جستجو، 104 مورد را بیپاسخ گذاشت.

این مطالعه نگرانیهای موجود درباره «توهمات» هوش مصنوعی را تأیید میکند، چرا که این مدلها حتی زمانی که اشتباه میکنند، با اطمینان کامل از درستی پاسخهای خود دفاع میکنند. با وجود این میزان خطا، شرکتهای فناوری همچنان برای ارائه نسخههای بهروزتر این ابزارها هزینههای بالایی (بین 20 تا 200 دلار در ماه) از کاربران دریافت میکنند، بدون اینکه بهطور شفاف به ضعفهای مدلهای خود اشاره کنند.
در حالی که برخی کارشناسان، مانند لنس اولانوف از TechRadar، از عملکرد سریع و بدون تبلیغ ChatGPT Search راضی هستند، اما دادههای این تحقیق نشان میدهد که کاربران باید نسبت به دقت اطلاعات ارائهشده توسط هوش مصنوعی محتاط باشند.