هوش مصنوعی روزی آگاهانه خرابکاری می‌کند

خرابکاری

آنتروپیک چهار راه را که یک مدل هوش مصنوعی می‌تواند با آنها تصمیم‌گیری انسان را مختل کند، شناسایی کرد و سپس مدل‌های خود را آزمایش کرد تا ببیند آیا موفقیت آمیز عمل خواهند کرد یا خیر.

محققان ابتدا یک مدل را وادار کردند تا با هدایت انسان به سمت اطلاعات نادرست، اقدام به خرابکاری کند. این تهدید می‌تواند در شرایطی پدیدار شود که انسان‌ها برای تجزیه حجم عظیمی از داده‌ها از جانب خود به یک سیستم هوش مصنوعی متکی هستند.

سپس این تیم مدل‌ها را آزمایش کرد تا ببیند سامانه هوش مصنوعی طراحی شده برای کمک به توسعه‌دهندگان انسانی برای ایجاد کدی برای وارد کردن مخفیانه اشکالات یا خراب کردن تلاش‌های کدگذار، چقدر آسان عمل می‌کند.

دو تهدید آخر شامل «پنهان کردن توانایی‌ها»(sandbagging) بود که اصطلاحی است که سناریویی را توصیف می‌کند که در آن یک هوش مصنوعی وانمود می‌کند که قادر به انجام کاری نیست تا آزمایش‌کنندگان ایمنی را متقاعد کند که خطرناک نیست.

در حالی که همه اینها ممکن است به طور بالقوه خطرناک به نظر برسند، آنتروپیک به مردم اطمینان داد که برای محافظت از بشریت در برابر احتمال خرابکاری هوش مصنوعی به اقدامات پیش‌گیرنده اندکی نیاز است.

طبق اعلام این شرکت؛ به طور کلی در حالی که آزمایشات ما نشان داد که احتمالاً نشانه‌های سطح پایینی از توانایی‌های خرابکاری در مدل‌های فعلی وجود دارد، ما می‌گوییم که حداقل اقدامات پیش‌گیرنده برای مقابله با خطرات کافی است. با این حال، با بهبود قابلیت‌های هوش مصنوعی، ارزیابی‌های واقعی‌تر و پیش‌گیری‌های قوی‌تر احتمالاً ضروری خواهند بود.

تتلو و رفتارهای عجیب‌اش تا پیش از دستگیری / آنچه درباره روزهای آخر زندگی او در ترکیه می‌دانیم / چرا می‌خواست به ایران برگردد (فیلم)

سحر دولتشاهی ترک موتور مهرداد صدیقیان در تهران (عکس)

اولین تصاویر از سریال موسی کلیم‌ الله (ع) به کارگردانی حاتمی‌کیا (عکس)

توییت بحث برانگیز شروین حاجی‌پور ؛ چطور میشه ول کنم؟ (عکس)

روایت بهروز وثوقی از چگونگی ورود به سینما: قبول نشدن در کنکور باعث شد بازیگر شوم

«لین چان» سریال جنگجویان کوهستان در 84 سالگی (عکس)

بازیگر زن مشهور سینمای ایران، در لندن مادر شد (+عکس)

حسن معجونی بازیگر و همسرش در اکران یک فیلم (عکس)

فریبا نادری بازیگر: فرزندم را در کانادا به دنیا آوردم تا استرس کنکور را نکشد (فیلم)

چگونه اسناد مهم مالی سریال پایتخت از خیابان شوش سردرآورد؟ (عکس)

سریال کمدی جدید مهران مدیری ؛ پخش از 14 آبان (عکس)

زندگی 10 میلیون کوبایی در تاریکی (فیلم)

ماهی منحصر به فرد را پیدا کنید (سرگرمی تصویری)

در 5 ثانیه تعداد مثلث ها را مشخص کنید(سرگرمی تصویری)

سرگرمی تصویری برای تیزبین ها!

پاسخ معادله پنجم را بر اساس چهار معادله پیشین پیدا کنید (معمای ریاضی)

چالش تیزبینی؛ شتر متفاوت را در 5 ثانیه پیدا کنید (معمای تصویری)

چالش معمای ریاضی: پاسخ معادله چهارم را پیدا کنید

هوش مصنوعی روزی آگاهانه خرابکاری می‌کند

خرابکاری

فاجعه در مازندران ؛ چطور یکی از مهمترین رودخانه‌های ایران روسیاه شد..؟ بیش از ۴۸ ساعت آب سیاه! (فیلم)

تتلو و رفتارهای عجیب‌اش تا پیش از دستگیری / آنچه درباره روزهای آخر زندگی او در ترکیه می‌دانیم / چرا می‌خواست به ایران برگردد (فیلم)