هوش مصنوعی، آزمون تورینگ را شکست داده است سئو سی: چت بات ها حالا در بازی تقلید مشهور ریاضی دان سرشناس آلن تورینگ، موفق ظاهر می شوند و اما تقلید، هیچ گاه به مدلول هوش نبوده است. با این وجود آیا نیاز به گزینه ای جایگزین برای آزمون تورینگ داریم؟ به گزارش سئو سی به نقل از ایسنا، امروزه پیشرفته ترین مدلهای هوش مصنوعی (AI) به آسانی از آزمون تورینگ عبور می کنند؛ آزمایشی فکری که می پرسد آیا یک کامپیوتر می تواند از طریق گفتگوی متنی، خویش را جای انسان جا بزند یا خیر. به نقل از نیچر، برخی، نسخه پیشرفته تری از این آزمون را معیاری ضروری برای سنجش پیشرفت به سمت «هوش مصنوعی عمومی» (AGI) می دانند که اصطلاحی مبهم است که خیلی از شرکت های فناوری برای اشاره به سامانه ای به کار می برند که بتواند در هر زمینه ای به اندازه انسان انعطاف ذهنی داشته باشد. اما در رویدادی که روز دوم اکتبر در «انجمن سلطنتی لندن» برگزار شد، چند پژوهشگر گفتند که باید آزمون تورینگ را کاملا کنار گذاشت و در عوض تمرکز را بر ارزیابی ایمنی هوش مصنوعی و ساخت توانایی های خاصی گذاشت که به سود عموم باشند. انیل سِث، عصب شناس دانشگاه ساسکس در برایتون، بریتانیا، می گوید: بیایید بفهمیم چه نوع هوش مصنوعی می خواهیم و بعد همان را بسنجیم. تمرکز بر این مسیر به سمت هوش عمومی مصنوعی، در واقع تخیل ما را در رابطه با نوع سیستم هایی که می توانیم در جامعه داشته باشیم یا نباید داشته باشیم، محدود می کند. این رویداد به مناسبت هفتاد و پنجمین سالگرد انتشار مقاله مهم «آلن تورینگ»، ریاضی دان بریتانیایی برگزار گردید. مقاله ای که در آن این آزمون را معرفی نمود و آنرا «بازی تقلید» نامید. تورینگ در آن مقاله به پرسش فلسفیِ دشوار «آیا ماشین ها می توانند فکر کنند؟» پرداخت. در این بازی، داور در چند گفتگوی کوتاه متنی با یک انسان یا یک ماشین شرکت می کند و اگر ماشین بتواند داور را قانع کند که انسان است، برنده می شود. رویکرد کم هیاهوی نشست به موضوع هوش ماشینی با استقبال روبه رو شد. در این رویداد ظرفیت سالن پر شده بود و بسیاری نیز آنرا به شکل زنده تماشا می کردند. مارکس در سخنرانی اصلی اظهار داشت: شاید ایده هوش عمومی مصنوعی اصلا هدف درستی نباشد، حداقل اکنون نباشد. او اضافه کرد: برخی از بهترین مدلهای هوش مصنوعی مانند آلفافولد (AlphaFold) خیلی تخصصی اند. آلفافولد سامانه پیش بینی ساختار پروتئین شرکت دیپ مایند (DeepMind) گوگل است. این مدل فقط یک کار انجام می دهد. فراتر از تورینگ آزمایش سرگرم کننده تورینگ اغلب به عنوان معیاری برای سنجش هوش ماشینی درنظر گرفته شده، اما به قول سارا دیلون، پژوهشگر ادبیات در دانشگاه کمبریج که آثار تورینگ را مطالعه می کند، تورینگ هیچ گاه قصد نداشت آنرا آزمونی جدی یا عملی بداند. امروزه توانمندترین سامانه های هوش مصنوعی، نسخه های پیشرفته مدلهای زبانی بزرگ (LLM) هستند که بر پایه پیش بینی متن و الگوهای زبانی یادگرفته شده از داده های اینترنتی عمل می کنند. در ماه مارس، محققان چهار چت بات را در نسخه ای از آزمون تورینگ آزمایش کردند و دریافتند که بهترین مدلها توانستند از آن بگذرند. بااین حال، این که چت بات ها بتوانند به خوبی سخن بگویند، به مفهوم داشتن درک واقعی از جانب آنها نیست. پاسخ های مدلهای زبانی بزرگ می تواند به صورت حیرت انگیزی انسانی به نظر برسد، اما وقتی از محدوده معمول پرسش هایشان خارج شوید، کاملا به دردسر می افتند. مارکس به عنوان مثال می گوید که برخی مدلها نمی توانند اجزای بدن فیل را درست نام گذاری کنند، یا عقربه های ساعت را جز در موقعیت خاصی رسم کنند. به همین دلیل، این مدلها هنوز هم امکان دارد در آزمون تورینگ شکست بخورند، اگر داوری آگاه از ضعف هایشان آنها را بیازماید. با این حال، پیشرفت سریع سیستم های مبتنی بر مدلهای زبانی بزرگ در حوزه های گوناگون، بخصوص در کارهای استدلالی، سبب شده برخی گمان کنند که شاید ماشین ها بزودی در آزمون های شناختی به سطح انسان برسند. برای سنجش توانایی های فزاینده هوش مصنوعی و مهارت های غیرزبانی، محققان در پی ساخت آزمون های دشوارتری هستند. چنین آزمون هایی معمولاً به عنوان نقاط عطف در راه رسیدن به هوش عمومی مطرح می شوند، اما محققان در رابطه با هیچ معیار واحدی برای تحقق هوش عمومی مصنوعی اتفاق نظر ندارند. مارکس می گوید که ارزیابی مناسب تر می تواند چیزی شبیه «المپیک تورینگ» باشد، شامل حدود دوازده آزمون مختلف که از درک فیلم و فهمیدن آن چه در آن می گذرد گرفته تا دنبال کردن دستورالعمل های مونتاژ یک وسیله چوبی. شَنِن وَلور، متخصص اخلاق هوش مصنوعی در دانشگاه ادینبرو، توضیح داد که معنای هوش در فرهنگ ها، محیط ها و دوره های مختلف و حتی میان گونه های زیستی متفاوت تغییر می کند. به جای پرسیدن این که آیا ماشین باهوش است، باید بپرسیم دقیقا این ماشین چه می کند؟ به قول او، تقسیم توانایی های ماشین به قابلیت های مجزا بطورمثال تمرکز فقط بر زبان، نه زبان به عنوان نشانه ای از توان شناختی کمک می نماید تا از نسبت دادن صفاتی مانند فهم یا همدلی به هوش مصنوعی پرهیز شود، چون که این خاصیت ها در انسان نشانه هوش هستند، ولی در ماشین الزاما این طور نیست. ویلیام آیزاک، پژوهشگر کاربردهای سیاستگذاری عمومی در شرکت گوگل دیپ مایند در لندن می گوید که آزمون تورینگ در آینده باید بسنجد که آیا یک هوش مصنوعی ایمن، قابل اعتماد و واقعاً مفید است یا خیر و همینطور باید بررسی کند که چه کسی هزینه این سود را می پردازد. او اضافه کرد: به عنوان دانشمندان، وظیفه داریم بر پایه شواهد تجربی موجود، استدلال هایی دقیق و هدفمند ارایه نماییم که از هیاهوی اغراق آمیز کاهش دهد.خلاصه اینکه تمرکز بر این مسیر به سوی هوش عمومی مصنوعی، در حقیقت تخیل ما را در ارتباط با نوع سیستم هایی که می توانیم در جامعه داشته باشیم یا نباید داشته باشیم، محدود می کند. در این بازی، داور در چند گفتگوی کوتاه متنی با یک انسان یا یک ماشین شرکت می کند و اگر ماشین بتواند داور را قانع کند که انسان است، برنده می شود. فراتر از تورینگ آزمایش سرگرم کننده تورینگ اغلب بعنوان معیاری برای سنجش هوش ماشینی دیده شده، اما به قول سارا دیلون، پژوهشگر ادبیات در دانشگاه کمبریج که آثار تورینگ را مطالعه می کند، تورینگ هیچگاه قصد نداشت آن را آزمونی جدی یا عملی بداند. 1404/07/30 16:44:20 5.0 / 5 14 تگهای خبر: اینترنت , بازی , تخصص , دانشگاه این مطلب سئوسی را می پسندید؟ (1) (0) تازه ترین مطالب مرتبط پیشرفت چین در ادغام هوش مصنوعی با تحقیقات علمی و پزشکی وقتی داده از زمین جدا می شود آینده هوش مصنوعی در فضا! افزایش کمک های رفاهی بازنشستگان وزارت ارتباطات تمرکز بر تولید ماهواره های مخابراتی با هدف ارایه خدمات با کیفیت نظرات بینندگان در مورد این مطلب نظر شما در مورد این مطلب نام: ایمیل: نظر: سوال: = ۶ بعلاوه ۲