به گزارش پایگاه شبکه الکوثر، از نیچر، شرکت فناوری OpenAI ماه گذشته زمانی که آخرین مدل آزمایشی چت بات خود، o3، در آزمونی که نشان دهنده پیشرفت به سمت هوش عمومی مصنوعی (AGI) بود، به امتیاز بالایی دست یافت. O3 OpenAI امتیاز 87.5 درصد را کسب کرد که بهترین امتیاز قبلی را برای سیستم هوش مصنوعی (AI) 55.5 درصدی شکست داد.
فرانسوا شولت، محقق هوش مصنوعی، که در سال 2019 در حین کار در گوگل مستقر در Mountain View، کالیفرنیا، این آزمایش را به نام Corpus انتزاعی و استدلال برای هوش عمومی مصنوعی (ARC-AGI)1 ایجاد کرد، میگوید: این یک پیشرفت واقعی است. Chollet می گوید که نمره بالا در آزمون به این معنی نیست که AGI – به طور کلی به عنوان یک سیستم محاسباتی که می تواند به خوبی انسان ها استدلال، برنامه ریزی و مهارت ها را یاد بگیرد – به دست آمده است، اما o3 “کاملا” قادر به استدلال و استدلال است. “قدرت تعمیم بسیار قابل توجهی دارد”.
بیشتــر بدانیــد:
25 دی ماه؛ تصويب طرح چاپ فرهنگ دهخدا
ضرورت آیندهنگری و برخورد فعالانه دین با مسائل نوپدید
t که اکنون در سیاتل، واشنگتن مستقر است، می گوید که صرف زمان بیشتر برای اصلاح یک پاسخ در زمان آزمون، تفاوت زیادی در نتایج ایجاد می کند. اما o3 هزینه هنگفتی دارد: برای انجام هر کار در تست ARC-AGI، حالت امتیازدهی بالا آن به طور متوسط 14 دقیقه طول کشید و احتمالاً هزاران دلار هزینه داشت. شیانگ یو در دانشگاه کارنگی ملون در دانشگاه کارنگی ملون می گوید (هزینه های محاسباتی تخمین زده می شود، Chollet می گوید، بر اساس میزان هزینه OpenAI از مشتریان در هر توکن یا کلمه، که به عواملی از جمله مصرف برق و هزینه های سخت افزار بستگی دارد.) این “نگرانی های پایداری را افزایش می دهد.” پیتسبورگ، پنسیلوانیا، که مدلهای زبان بزرگ (LLM) را مطالعه میکند که رباتهای گفتگو را تقویت میکنند.
اگرچه اصطلاح AGI اغلب برای توصیف یک سیستم محاسباتی استفاده می شود که توانایی های شناختی انسان را در طیف وسیعی از وظایف برآورده می کند یا از آن فراتر می رود، هیچ تعریف فنی برای آن وجود ندارد. در نتیجه، هیچ اتفاق نظری درباره زمانی که ابزارهای هوش مصنوعی ممکن است به AGI دست یابند، وجود ندارد. برخی می گویند لحظه از قبل فرا رسیده است. دیگران می گویند هنوز دور است.
تست های زیادی برای پیگیری پیشرفت به سمت AGI در حال توسعه هستند. برخی از آنها، از جمله پرسش و پاسخ Google-Proof 2023 Rein، برای ارزیابی عملکرد یک سیستم هوش مصنوعی در مسائل علمی در سطح دکترا در نظر گرفته شده است. میز MLE 2024 OpenAI یک سیستم هوش مصنوعی را در برابر 75 چالش میزبانی شده در Kaggle، یک پلت فرم آنلاین رقابت علم داده، قرار می دهد. چالشها شامل مشکلات دنیای واقعی مانند ترجمه طومارهای باستانی و ساخت واکسنها میشود.
ویژههای الکوثر را اینجا دنبال کنید.
برای اطلاع از آخرین خبرهای ایران و جهان اینجا کلیک کنید.
چهار شنبه 26 دی 1403 - 14:55:18