“Anthropic Claude” MI modeļi tagad var pārtraukt “kaitīgas vai aizskarošas” sarunas

Pēdējā laikā “Anthropic” savam mākslīgā intelekta (MI) čatbotam “Claude” pievienojis vairākas noderīgas funkcijas, tostarp spēju atcerēties iepriekšējās sarunas. Tagad uzņēmums informējis, ka tā vadošie MI modeļi – “Claude Opus 4″ un “Claude Opus 4.1” -var pārtraukt sarunas, kas tiek uzskatītas par “pastāvīgi kaitīgām vai aizskarošām”. Visai pārsteidzoši, ka “Anthropic” apgalvo, ka tas tiek darīts nevis lietotāju drošības dēļ, bet MI modeļu aizsardzībai.

Sarunas pārtraukšanu “Anthropic” raksturo kā “pēdējo līdzekli” pēc tam, kad lietotāji atkārtoti lūguši “Claude” čatbotam ģenerēt potenciāli kaitīgu saturu, neņemot vērā iepriekšējos atteikumus to darīt. Ja “Claude” izvēlēsies pārtraukt sarunu, lietotājs vairs nevarēs sūtīt jaunas ziņas šajā konkrētajā sarunā. Tiesa, joprojām būs iespēja veidot jaunas sarunas un atkārtoti mēģināt nosūtīt iepriekšējos ziņojumus ar lūgumu ģenerēt nevēlamu saturu. Taču šādā veidā lietotājs, visticamāk, tikai izšķiedīs laiku, jo atkal saņems “Claude” atteikumu.

Testējot “Claude Opus 4” MI modeli, “Anthropic” secināja, ka tas izrādīja “spēcīgu un pastāvīgu nepatiku pret kaitīgu saturu”. Tas izteikti tika novērots situācijā, kad čatbotam tika lūgts uzģenerēt seksuāla rakstura saturu, kas saistīts ar nepilngadīgajiem, kā arī tad, kad tam bija jāsniedz informācija, kas varētu veicināt teroristikas darbības. Uzņēmums apgalvo, ka šajos gadījumos “Claude” izrādīja “acīmredzamas ciešanas” un “vēlmi pēc iespējas ātrāk pārtraukt šīs kaitīgās sarunas”.

Vienlaikus “Anthropic” norāda, ka sarunas, kas izraisa šāda veida reakciju no čatbota, esot “ekstrēmi gadījumi” un piebilst, ka lielākā daļa lietotāju ar to nesaskarsies, pat ja tēmas būs pretrunīgas, ieskaitot kaitējuma nodarīšanu sev vai citiem. Šajā ziņā uzņēmums sadarbojas ar tiešsaistes krīzes atbalsta sniedzēju “Throughline”, kas palīdz ģenerēt atbildes uz vaicājumiem, kas saistīti ar paškaitējumu un garīgo veselību.

Paziņot par jaunumiem

Vārds*

E-pasta adrese*

5 komentāri

Ir vārdam vieta

20.08.2025 13:24

Viena no lietām, kas mašīnu izpildījumā bojās un traucēs cilvēka dzīvei nākotnē – jau tagad traucē, un dažos gadījumos nepārsūdzami – ir minēta šajā rakstā. Atliek tikai sastādīt noteikumus ar nevēlamiem atslēgas vārdiem. Ieskaitot ar rupjām loģikas kļūdām, bet ar formāli attaisnotu pieeju. Bots no viena DC++ kolektīvā čata meta ārā par to, ka uzrakstīji vārdus Piebalgas alus. Tagad tas ir nonācis jaunā līmenī.

Atbildēt

Asaris

20.08.2025 16:05

Reply to Ir vārdam vieta

Jā un uzbrukuma taktiku arī neatklāj. Tikai aizsargāties un vērsties policijā. Tas viss domāts dārzeņiem. Dc++ brīvi lejuplādē porno bet piebalgas alu filtrē. Dilema.

Last edited 9 months ago by Asaris

Krotow

20.08.2025 16:13

Reply to Asaris

Tur nav daudz variantu. 1) DC servera admins dēļ jaunības muļķības reiz pārlietojies Piebalgas alu un tagad viņam pret to ir alerģija, 2) viņš ir daļā ar kādu citu alus ražotāju.

20.08.2025 18:37

Reply to Krotow

Senāk.kaut kādā tusiņā dzirdeēju kaut kāda prinča viedokli uzskatu, ka ir tādas meitenes kuras ir kā alus. Viegli dabūt, padzert, neliels reibums un atslābinājums. Varbūt šis savā demobiskajā hubā vēršas pret cilvēkiem kuru ar Piebalgas alu domā meitenes no piebalgas.

26.08.2025 10:16

Ir viens, ko tu nesaskati. Vārdā Piebalga ir atrodams lamu vārds ebal. :) Šis ir labs piemērs mašinālai domāšanai un izpildījumam.

“Sony X1000 THE COLLEXION” premium bezvadu austiņu apskats – šika dzimšanas dienas dāvana!

Iepazīstamies ar “Denon Home 200”, “Denon Home 400” un “Denon Home 600” bezvadu skandām

“Xiaomi Watch 5” viedpulksteņa apskats – vairāk, nekā sākumā varētu nojaust

“Mobvoi TicNote” apskats – digitālie balss ieraksti un pieraksti kļuvuši vienkāršāki

Jauns likumprojekts varētu liegt “Mercedes” tirgot mašīnas ASV

“Tesla Cybertruck” par ko pircēju reiz samaksāja līdz pat 150 000 dolāru, piedzīvo brutālu cenu kritumu

Baltijas valstīs beidzot oficiāli ienāks “Polestar” auto zīmols

“Uber” plāno autonomo taksometru testu programmu Minhenē

“ASUS” prezentē iespaidīgu “ROG Astral GeForce RTX 5090 Edition 20” videokarti ar 800W jaudu un AMOLED ekrānu

“Qualcomm” ar “Snapdragon C” procsoru dosies cīņā pret “Apple MacBook Neo”

“Dell” atgriež leģendāro “XPS 13” kā pieejamas cenas “MacBook Neo” konkurentu

“Intel” piesaka jaunos “Arc G” sērijas procesorus nākamās paaudzes portatīvajām spēļu konsolēm

Ko Kursors Tev Neraksta #186

Ko Kursors Tev Neraksta #185 + Reinis Traidās

Ko Kursors Tev Neraksta #184

Ko Kursors Tev Neraksta #183 + Dāvids Rundelis (CellDrive)

Piedalies Kursors.lv konkursā un laimē “Xiaomi Oscillation Electric Toothbrush Pro” zobu birsti (noslēdzies)

Piedalies Kursors.lv konkursā un laimē “herQs Pin Pro” viedo gaļas termometru (noslēdzies)

Piedalies Kursors.lv konkursā un laimē Nothing Phone (2) Plus viedtālruni (noslēdzies)

Logitech MX ERGO datorpeles konkurss (noslēdzies)

“Anthropic Claude” MI modeļi tagad var pārtraukt “kaitīgas vai aizskarošas” sarunas

Jaunākie raksti

Neesi stulbs un lidojuma laikā nenosauc savu ierīci šādos nosaukumos

“Ferrari” nebūvēs pašbraucošus auto, un arī iekšdedzes dzinēji nekur nepazudīs

Jauns likumprojekts varētu liegt “Mercedes” tirgot mašīnas ASV

Floridas štats iesūdz “OpenAI” un Semu Altmenu par “ChatGPT” radītajiem drošības riskiem

Ķīnā ar vairāk nekā 33 tūkstošiem dronu uzstādīti trīs jauni Ginesa rekordi

Jaunākie komentāri