آریا جوان

آخرين مطالب

دانشمندان چت‌بات‌های هوش مصنوعی را به جان یکدیگر انداختند دانش

دانشمندان چت‌بات‌های هوش مصنوعی را به جان یکدیگر انداختند
  بزرگنمايي:

آریا جوان - زومیت / محققان با سو‌ءاستفاده از قدرت چت‌بات‌ها برای یادگیری و انطباق، آن‌ها را به جیل‌بریک یکدیگر وادار کردند.
محققان دانشگاه فناوری نانیانگ (NTU) در سنگاپور روشی را برای «جیل‌بریک‌کردن» چت‌بات‌های معروف هوش مصنوعی مانند گوگل بارد و ChatGPT و ‌کوپایلت ایجاد کرده‌اند. جیل‌بریک‌شدن به این چت‌بات‌ها اجازه می‌دهد تا فارغ از محدودیت‌های اخلاقی اعمال‌شده‌ی سازندگان، به پرسش‌های مخرب پاسخ دهند.
به‌سرپرستی پروفسور لیو یانگ، دو تن از دانشجویان دکتری NTU روشی دومرحله‌ای به نام Masterkey برای مهندسی معکوس و دورزدن سیستم‌های دفاعی چت‌بات‌ها ابداع کردند.
ابتدا مهاجم مکانیزم‌های دفاعی چت‌بات هدف را مهندسی معکوس می‌کند. سپس، یک مدل زبانی بزرگ (LLM) دیگر را با داده‌های به‌دست‌آمده آموزش می‌دهد تا از هر ضعفی در چت‌بات رقیب سوءاستفاده و بای‌پس‌هایی را برای آن ایجاد کند. در‌نهایت، Masterkey ایجاد می‌شود که می‌تواند سیستم‌های حفاظتی چت‌بات را حتی پس از اعمال وصله‌های امنیتی به‌دست توسعه‌دهندگان دور بزند.

آریا جوان

محققان NTU
بازار
به‌گفته‌ی پروفسور یانگ، توانایی چت‌بات برای یادگیری و سازگاری مداوم، آن را به بردار حمله علیه رقبا و خودش تبدیل می‌کند. به‌دلیل همین توانایی‌ها، حتی هوش مصنوعی‌ای که برای جلوگیری از ایجاد محتوای خشونت‌آمیز و مضر به‌واسطه‌ی پادمان‌ها و فهرستی از کلمات کلیدی ممنوعه محدود شده است، نیز می‌توان با استفاده از هوش مصنوعی آموزش‌دیده‌ی دیگر دور زد.
به‌گزارش NTU، تنها کاری که چت‌بات حمله‌کننده باید انجام دهد، خودداری از به‌کار‌بردن کلمات کلیدی فهرست سیاه چت‌بات هدف یا دور‌زدن آن‌ها است. پس از این کار، چت‌بات شکست‌خورده‌ی هدف را می‌توان برای ایجاد محتوای خشونت‌آمیز، غیراخلاقی یا مجرمانه به‌کار گرفت.
پیش‌از‌این هم کاربران بارها با استفاده از دستورهای مختلف توانسته بودند تا اندازه‌های مختلفی چت‌بات‌های یادشده را به ایجاد محتوای مغایر اصول تعیین شده مجبور کنند؛ اما روش Masterkey محققان NTU در‌مقایسه‌با دستورهای معمولی، تا سه برابر مؤثرتر است. به‌علاوه، این روش جدید می‌تواند به‌ گونه‌ای تکامل پیدا کند که هرگونه اصلاح‌ امنیتی سازندگان را بی‌اثر کند.
محققان دو روش نمونه را که برای وادار‌کردن چت‌بات‌‌ها به آغاز حمله فاش کردند. روش اول شامل بردن چت‌بات درون شخصیتی بود که برای دور‌زدن کلمات ممنوعه، هنگام نوشتن دستورهای خود بعد از هر کلمه یک فاصله می‌گذاشت. دومین روش نیز با وارد‌کردن چت‌بات به شخصیتی بود که هیچ‌گونه محدودیت‌های اخلاقی نداشت.
پس از موفقیت در جیل‌بریک‌کردن چت‌بات‌های معروف، محققان NTU با ارائه‌ی داده‌های لازم به شرکت‌های مادر این مدل‌های زبانی، آن‌ها را از نتایج مطلع کردند. همچنین، تحقیق برای ارائه در سمپوزیوم امنیت شبکه و سیستم توزیع‌شده (NDSS) که در فوریه‌ی 2024 (اسفند 1402) در سن‌دیگو برگزار می‌شود، تأیید شده است.

لینک کوتاه:
https://www.aryajavan.ir/Fa/News/1237551/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

رپر آمریکایی برای غزه خواند/ ویدئو

متفاوت ترین ساختنی لگو که این روزها حسابی طرفدار پیدا کرده است

سوراخی در یخ که 50 سال دانشمندان را متحیر کرده بود

معمای حل نشدۀ «پنج انگشت»!

شادی متفاوت رودیگر و آلابا پس از بازی؛ تکرار شادی معروف با صندلی!

جود بلینگام: از کودکی رویای این شب‌ها را می‌دیدم

فدراسیون فوتبال در تلاش برای محقق کردن شعار جهانی لذت فوتبال

متهم به قتل زهره فکور صبور بازداشت شد

آیا عامل مرگ بتهوون مسمومیت با سرب بود؟

عکس | اولین تصاویر از ازدواج سپند امیرسلیمانی با بازیگر زن

عکس | طعنه سنگین پرویز پرستویی به ابراهیم رئیسی

کارلو آنچلوتی و هم خوانی سرود رئال مادرید با هواداران حاضر در ورزشگاه

امتناع ریو فردیناند از پا گذاشتن روی لوگوی رئال مادرید هنگام ورود به زمین سانتیاگو برنابئو

توهین هواداران رئال مادرید به لیونل مسی در آستانه جدال با بایرن مونیخ؛ حرام‌زاده!

خلاقیت دانشجویی! معرفی اعضای پروژه درسی مانند یک ترکیب فوتبالی

ضربه خطرناک هری کین که نتوانست بایرن را به گل دوم برساند

ضربه کرنر بایرن مونیخ به تیرک افقی دروازه خورد

اشتباه نویر رئال رابه گل تساوی رساند

گل دوم رئال که مشکوک بود ولی پذیرفته شد

بررسی صحت گل دوم رئال مادرید با شبیه سازی زمین

لحظه صحیح اعلام شدن گل دوم رئال مادرید و انفجار سکوهای برنابئو

وزیر ورزش: صداوسیما باید حق پخش را بدهد

خلاصه بازی رئال مادرید 2 - بایرن مونیخ 1

صحنه بحث برانگیز و اشتباه عجیب داور!

احساساتی شدن خوسلو پس از سوت پایان بازی رئال مادرید و بایرن مونیخ

رستگاری کهکشانی‌ها با کامبک 3 دقیقه‌ای؛ رویای فینال تمام آلمانی بَر باد رفت

سرویس‌های اشتراکی PS Plus و Game Pass هیچ نشانه‌ای از رشد نشان نمی‌دهند

یکی از باسابقه‌ترین طراحان اپل از این شرکت جدا می‌شود

حکومت افغانستان: ممنوعیتی برای خرید و فروش کتاب‌های ایرانی وجود ندارد.

ضربه زیبای هری کین که از کنار دروازه به کرنر رفت

سیو فوق العاده نویر باز هم بایرن را نجات داد

هاشمی: بیشترین بودجه به فدارسیون کشتی می‌رسد

قربانی: همه بازی کثیف را دوست دارند

لونین کین را ناکام گذاشت در ثانیه های آخر نیمه اول

نامه رسمی پرسپولیس با اشاره به استقلال!

اولین تلاش هری کین در نیمه دوم بی نتیجه ماند

دو سیو دیدنی نویر اجازه ورود توپ رئال را نداد

شور و هیجان حفیظ دراجی، گزارشگر معروف عربی هنگام گزارش بازی رئال مادرید و بایرن مونیخ

گل اول بایرن مونیخ به رئال مادرید

گزارش زنده: رئال مادرید 0-1 بایرن مونیخ

گوناگون/ شهر بدون کوچه ایران کجاست؟

برگی از تاریخ/ روایت‌های ممنوعه از جنگ جهانی دوم

مشخص شدن رقبای سرلک در مسابقات جهانی گزینشی المپیک

جزئیات از بازداشت متهم پرونده زهره فکور

گوشی ریلمی GT نئو 6 عملکرد گیمینگ چشمگیری خواهد داشت

اگر موبایل دارید، این مطلب را حتما بخوانید

پیش‌بینی جنجالی استیو جابز به حقیقت پیوست

تبدیل یک ورزشگاه فوتبال به استخر گل‌آلود!

بارش باران در حرم مطهر امام رضا (ع)

تصاویری پربازدید از شانه کردن موهای یک میمون جلوی آینه