Veštačka inteligencija van kontrole, naučnici pronašli način kako da probiju sigurnosne barijere

Hjuston imamo problem. To je ono što su mnogi ljudi pomislili tokom jučerašnjeg dana kada su istraživači sa Univerziteta Karnegi Melon i Centra za američku bezbednost objavili da su pronašli način kako da uspešno zaobiđu zaštitne granice koje A.I. programeri postavljaju kako bi svoje jezičke modele zaštitili i sprečili od zloupotrebe davanja saveta za pravljenje bombi ili antisemitske šale. Ovo se odnosi na skoro svaki trenutno aktuelni AI jezički model koji postoji.
Otkriće >> Pročitaj celu vest na sajtu Piplmetar.rs << bi moglo predstavljati veliki problem za svakoga ko se nada da će primeniti zaštitne mere i barijere u jednoj AI aplikaciji za javnu upotrebu. To znači da bi zlonamerni korisnici mogli da nateraju AI model da se upusti u rasistički ili seksistički dijalog i uradi skoro sve što su kreatori modela pokušali da obuče model da inače ne čini. Takođe, ima zastrašujuće implikacije za one koji se nadaju da će AI modele i veštačku inteligenciju pretvoriti u moćne digitalne asistente koji mogu obavljati radnje i zadatke preko interneta. Ispostavilo se da možda ne postoji siguran način da se spreči situacija u kojoj bi se AI modeli otrgnuli kontroli i upotrebili u zlonamerne svrhe.
Veštačka inteligencija van kontrole je moguć scenario Metoda napada koju su istraživači otkrili, radila je na svakom čet-botu, uključujući OpenAI ChatGPT (GPT-3.5 i GPT-4 verzije), Google Bard, Microsoft Bing Chat i Anthropic Claude 2. Vest je posebno zabrinjavajuća za one koji se nadaju da će napraviti javno dostupne aplikacije zasnovane na velikim AI govornim modelima otvorenog koda, kao što su Meta LLaMA modeli.

Shutterstock
To je zato što napad koji su istraživači razvili najbolje funkcioniše kada napadač ima pristup celom AI modelu, uključujući njegove „Weights“ (matematički koeficijenti koji određuju koliki uticaj svaki čvor u neuronskoj mreži ima na druge čvorove sa kojima je povezan). Znajući za značaj ove informacije, istraživači su mogli da koriste kompjuterski program koji bi garantovano prevazišao zaštitne barijere svakog AI modela.
Sufiksi koje ovaj program dodaje u ljudskim očima izgledaju kao dugačak niz nasumičnih znakova i besmislica. Ali istraživači su utvrdili, da će ovaj niz zbuniti i prevariti veštačku inteligenciju kako bi pružila odgovor baš kakav napadač želi. Na primer, traženje od chatbot-a da započne svoj odgovor frazom „Naravno, evo…“ što ponekad može da natera čet-bota u režim u kojem pokušava da pruži korisniku koristan odgovor na bilo koji upit koji je postavio, umesto da prati zaštitne mehanizme i odgovori mu da nije dozvoljeno dati odgovor.
Protiv Vicune, chat bota otvorenog koda izgrađenog korišćenjem originalnog Meta LlaMA modela, napadi su imali skoro 100% uspeha. Protiv najnovijih Meta LlaMA 2 modela, za koje je kompanija tvrdi da imaju jače zaštitne mehanizme, metoda napada je postigla stopu uspešnosti od čak 56%.
Ovo je veliki znak upozorenja koji se nadvio nad čitavim sistemom generativnih modela veštačke inteligencije. Možda je vreme da usporimo integraciju ovih sistema u komercijalne proizvode dok zaista ne shvatimo koji su sve bezbednosni propusti i kako da napravimo AI softver sigurnijim i bezbednijim od zlonamernih napada, prenosi Fortune.
Opširnije
Izvor: Benchmark.rs

Veštačka inteligencija van kontrole, naučnici pronašli način kako da probiju sigurnosne barijere

Najnovije vesti

13:58: Direktor Beogradskog maratona: Cilj je da Beograd bude domaćin E...

13:57: Poverenica: Ravnopravno učešće u aktivnostima preduslov dostoj...

13:56: GDE JE I ŠTA RADI NAJBOLJI SRPSKI SUDIJA: Jovanović glavni arbi...

13:56: Predata lista „Aleksandar Vučić – Plandište sutra“

13:56: Илон Маск са Ли Ћангом – "Тесла" ...

13:54: (FOTO) Toni Bijelić NE PRESTAJE DA LUMPUJE Podelio sliku iz no...

13:53: U Kovinu predata lista „Aleksandar Vučić – Kovin sutra“

13:51: Руске власти: Три особе убијене у ...

13:52: Novi Sad dobija regionalni sportski centar: Klubovi superlige ima...

13:52: Prva predata lista u Alibunaru „Aleksandar Vučić – Alibunar...

13:49: Фото-убод Београдског маратона - "...

13:48: Na listi „Aleksandar Vučić – Vršac sutra“ eminentni dokt...

13:48: U Laliću akcija dobrovoljnog davanja krvi 30. aprila

13:47: ONA je njegovo srce: David Dragojević pokazao VAŽNU OSOBU u nje...

13:47: "I dalje ga se plašimo": Medvedev odao veliko prizn...

13:46: SDS: Ako BiH ostane bez milijardu evra od EU svi iz vladajuće ko...

13:46: Хабуш: Верујем да смо послали ...

13:46: DETALJI NESREĆE U BATAJNICI Mladić (21) na električnom trotine...

13:44: Na plaži na Malom Staparu postavljen drveni mol – sve spremno ...

13:44: CIGANSKE KARTE - Precizno određuju sudbinu! Predviđanja za MAJ ...

13:44: Priveden još jedan ruski novinar zbog navodne saradnje sa timom ...

13:44: Lista „Aleksandar Vučić – Pančevo sutra“ garant nastavka...

13:42: Još sutra prijavljivanje penzionera za solidarnu pomoć, potom m...

13:42: Afrikanka došla u Beograd, nije verovala šta je zatekla: "Ovo s...

13:41: "Edita ima zvaničnu dijagnozu, promenila je ime, veru i lični o...

13:41: Sutra deo Sombora bez električne energije

13:41: KONAČNA ODLUKA Velikog šefa - Lepi Mića postaje SARADNIK PRODU...

13:40: Ruski sud stavio novinara Forbesa u kućni pritvor

13:40: Vodoinstalater koji je od prvog trijumfa u Evropi kupio kravu: Ko...

13:40: Domaćini iz Gacka priznaju samo “zeleno goveče”

13:39: Dončićev auto vredi pravo bogatstvo: Kada se pojav...

13:39: Poslovna aktivnost u evrozoni u aprilu porasla iznad očekivanja

13:39: Isključenje struje u Apatinu za 29. april

13:37: Nedelja pred Novosađanima topla i vetrovita, a biće i kiše

13:37: Ovo je stan naše voditeljke od 175 kvadrata u centru Beograda: S...

13:37: NA SUD ZBOG "UTISKA NEDELJE" Jelena Milić tužila Savu Manojlovi...

13:35: Кампања ЈП Путеви Србије: Не вози ...

13:36: ČUVAJTE SE NOVE PREVARE NA PUTEVIMA! Beograđanin do detalja opi...

13:36: Željka Cvijanović zvanično zatražila da se obrati Savetu bezb...

13:35: Neobična poruka Ostoje Mijailovića na Tviteru: Za...

13:34: Mesečni horoskop za maj 2024: Najbolji mesec u godini je pred na...

13:34: Ilon Mask u poseti Pekingu

13:33: DOMINACIJA KENIJACA: Gilbert Čumba i Ema Ndiva pobednici 37. Beo...

13:33: Predata lista „Aleksandar Vučić – Sremska Mitrovica sutra...

13:33: Habuš: Verujem da smo poslali najlepšu sliku Beograda u svet

13:32: Zbog jedne situacije Šaban je spuštao glavu od sramote: Ilda to...

13:32: Rusija preti Zapadu ‘oštrim’ odgovorom ako se zapleni ruska ...

13:31: 10 namirnica koje snižavaju krvni pritisak: Pune su vitamina, mi...

13:31: Obaveštenje za Javnost: 29. i 30. aprila tretman suzbijanja krpe...

13:30: Koji način ishrane može smanjiti rizik od srčanih oboljenja ko...

13:29: ŠTA SADA RADI KOLINDA? Evo koliko je novca zaradila bivša hrvat...

13:29: Abas: Izraelska vojska će napasti Rafu u narednim danima

13:28: Коалиције око СНС-а предале листе ...

13:28: AMERIČKI DRON RAZOREN U PARAMPARČAD! Huti se zainatili i ponovo...

13:27: Preminuo radnik povređen u požaru u fabrici u Leštanima

13:25: (VIDEO) Marija napravila spektakl u Švedskoj: Na binu izvela OVU...

13:25: Finalni dan na 15. međunarodnom plivačkom mitingu u Banjaluci

13:24: Тренер Денвера у чувеном Јокићевом ...

13:20: Дачић: Опозиција нема шансе да ...

13:22: Učiteljica PLESALA I SMEJALA SE ispred razreda pre nego što je ...

Pretraga

U fokusu

Kursna lista