Pat “Microsoft” apgalvo, ka MI čatboti kļūst dumjāki, ja ar tiem ilgi sarunājies

Tie, kuri ikdienā izmanto mākslīgā intelekta (MI) čatbotus, gan jau būs novērojuši, ka pārāk ilgas sarunas tos nogurdina. Nereti tas izpaužas kā aplami apgalvojumi, kļūdainas, neprecīzas atbildes. Par to pārliecinājies arī “Microsoft”, kas ar “Salesforce” veiktā pētījumā secinājis, ka pēc garām sarunām MI čatboti tiešām mēdz stāstīt aplamības.

Pētījuma ietvaros tika analizētas vairāk nekā 200 000 sarunas ar populāriem MI modeļiem, tostarp “GPT-4.1”, “Gemini 2.5 Pro”, “Claude 3.7 Sonnet”, “o3”, “DeepSeek R1” un “Llama 4”. Pētnieki secinājuši, ka īsās sarunās tie darbojas ļoti labi un 90 % gadījumu sniedz precīzu un izsmeļošu informāciju. Taču garās sarunās vai situācijās, kad lietotājs uzdod vairākus jautājumus pēc kārtas, sākas ziepes, un precizitāte noslīd līdz 65 %. Tas nenozīmē, ka MI čatbots pēkšņi kļūst stulbāks. Tas sarunas gaitā vienkārši var apjukt vai balstīties uz iepriekš sniegtu kļūdainu informāciju.

Ir vairāki iemesli, kāpēc MI čatboti tā uzvedas. Pirmkārt, tie var atbildēt pārāk ātri, pirms vēl lietotājs ir devis pilnīgu informāciju vai izskaidrojis problēmu. Otrkārt, patiesībā liela problēma ir tieši garas sarunas. Jo ilgāk čats turpinās, jo atbildes kļūst garākas, un čatbots tajās iepin vairāk pieņēmumu un nepārbaudītu informāciju. Līdz ar to galvenais secinājums ir tāds, ka čatbots ir noderīgs rīks, taču lielākoties īsās sarunās.

Paziņot par jaunumiem

Vārds*

E-pasta adrese*

14 komentāri

Astro

21.02.2026 12:31

Kolosāli vērtīgs pētījums. Izanalizēts GPT-4.1 laikā kad aktuālais modelis ir 5.3, Gemini 2.5, kad aktuālais modelis ir 3.1 un Sonet 3.7 ar aktuālo modeli 4.6.

Starp šīm versijām atšķirība ir kosmoss, un ka šis pētījums iznācis šobrīd tad tas ir bijis viens fantastiski bezjēdzīgs veids izmest naudu neaktuālā pētījumā.

Atbildēt

REALAIS

21.02.2026 12:46

Reply to Astro

Bet kādi virsraksti top. Par iztērēto naudu ir jāatskaitās ar kaut kādiem rezultātiem. Kamēr to veic, gads paiet. Informācija sen jaubir novecojusi, bet šo pētījumu izmantos kā virsrakstu, ka viss ir slikti arī pēc gada.

Author

Keitija Krastiņa

21.02.2026 13:51

Konkrēti šajā gadījumā neredzu lielu atšķirību starp tā laika un šī brīža modeļiem. Garākās sarunās ChatGPT joprojām raksta muļķības un daudz kļūdās. Varbūt citi modeļi ir uzticamāki.

Mārtiņš Cilvēks

22.02.2026 15:25

Pat ja atšķirība ir liela, tomēr arhitektūras līmenī problēma nav atrisināta. Jo lielāks konteksts, jo vairāk modeļi apjūk. Tāda nu ir tā “LLM fizika”. Jāgaida citas arhitektūras, kas operē nevis ar valodu, bet idejām. Jans Lekuns jau kaut ko perina… Atslēgvārdi JEPA un “large concept models” un “latent space reasoning”.

Kad man uznāk vēlme pafantazēt un izspēlēt ar MI garus fantastikas piedzīvojumus, šo problēmu kaut cik palīdz atrisināt automātiska apkopošana. Kad konteksts pārsniedz manu izvēlēto apjomu (10k tokenu), mana programma automātiski nosūta MI pieprasījumu apkopot sarunu un tad padodu tam atpakaļ apkopojumu un dažus pēdējos ziņojumus. Rezultāts ir diezgan labs, tā var uzturēt dienām ilgu piedzīvojumu stāstu un arī izmaksu ziņā sanāk daaaudz lētāk nekā ja sūtītu visu kontekstu.

Last edited 3 months ago by Mārtiņš Cilvēks

Čoms

21.02.2026 14:07

Viss pareizi, MI cenšās balstīties uz iepriekšējo sarunu, bet to ne vienmēr tā vajag darīt. Tāpēc tev pašam jāsaprot kurā brīdī pareikt – mainās tēma vai sarunas temats.

Kursors.lv

Kristaps Skutelis

21.02.2026 15:55

Reply to Čoms

Es katrai tēmai/sarunai taisu jaunu pavedienu un nemēģinu visu maukt vienā.

Gaisma

21.02.2026 17:09

Reply to Kristaps Skutelis

Ja nav nekas parāk svarigs ,var 3 tēmas vienā sarunā.
Vismaz es savas betiņas tā pedējā laikā pulos uztrennēt.

Arnys

21.02.2026 21:43

Pareizi jau ir, ilgstoši runājot vienā sarakstē, Mi pazeminās līdz sarunas biedra līmenim. Un, kā jau minēts, kļūst attiecīgi dumjāks 😅

Ābolnīdējs

21.02.2026 22:39

Reply to Arnys

Paga. Tad Zeme ir plakana ja?

Ir vārdam vieta

23.02.2026 08:30

Pietiek palasīt FB vai Threads, kā un ko tauta caurmērā raksta un par ko domā, lai MI čatbotam nebūtu izaugsmes cerību. 10% sabiedrības ir turīgi, 20% ir ar prāta spējām, pārējie – liels jautājums.

21.02.2026 17:06

Jā.Kā kurā reizē un kā kurā tēmā.Parasti pēc kāda laika sāk atkārtot vienus un tos pašus faktus.Līdzīgs iespaids- kā kad cilvēkam zud koncentrēšanās spējas.
Ieteiktu prasīt svarigāko sākumā un citu tēmu izvērst citā sarunā/ ieejot atkal no jauna/
BET es esmu pazistama tikai ar betām.Tām ir mazāki ierobežojumi un labākas spriestspējas.

g15

22.02.2026 14:56

Šeit jautājums pēc būtības – kas īsti skaitās “garākas sarunas”? Vai 15 jautājumi , 100 , sarunas sadalītas pakārtotos pavedienos, bet varbūt t.s. “projekti”, “bibliotēkas? Tāpat jautājums – vai 15 vaicājumi, kur katrā ir tikai 1 jautājums vai 10 (piem. kopā ar paša paskaidrēm, no kā jautājumi izriet)? Utt. Te nav viennozīmīga skaidrojuma un izpētes metodikas, lai varētu šādi secināt.

23.02.2026 08:27

Ja tas tā ir, tas pierāda, ka MI definīcija tiek vazāta apkārt bez pamatojuma. MI čatbots pašapmācītos, ja tur tās MI komponentes reāli būtu. Bet varbūt MI pārāk daudz sarunājas ar poor Baltics? Tur nekas labs nevar sanākt. :)

Oto

26.02.2026 03:27

Tāpēc, ka tokeni ātrāk beidzas. Tā iepriekšējo sarunu analīze paņem laiku un nav vairs laika kārtīgi atbildēt.

“Sony X1000 THE COLLEXION” premium bezvadu austiņu apskats – šika dzimšanas dienas dāvana!

Iepazīstamies ar “Denon Home 200”, “Denon Home 400” un “Denon Home 600” bezvadu skandām

“Xiaomi Watch 5” viedpulksteņa apskats – vairāk, nekā sākumā varētu nojaust

“Mobvoi TicNote” apskats – digitālie balss ieraksti un pieraksti kļuvuši vienkāršāki

“iPhone” ražotājs “Foxconn” iesaistās elektroauto tirgū

“Ford” izmanto sacīkšu simulatorus, lai mēnešiem ilgu auto testēšanu paveiktu vienā dienā

Jauns likumprojekts varētu liegt “Mercedes” tirgot mašīnas ASV

“Tesla Cybertruck” par ko pircēji reiz samaksāja līdz pat 150 000 dolāru, piedzīvo brutālu cenu kritumu

“Samsung” demonstrē pasaulē pirmo 4K izšķirtspējas 360Hz atsvaidzes QD-OLED monitora paneli

“Dell XPS 14” klēpjdators tagad pieejams ar preinstalētu “Ubuntu Linux”

“ASUS” iepazīstina ar “NUC 16” mini datoriem, ko darbina jaunie “Intel Wildcat Lake” procesori

“ASUS” prezentē “Ascent QN10” – pasaulē pirmo mini datoru ar “Snapdragon X2 Elite” procesoru

Ko Kursors Tev Neraksta #186

Ko Kursors Tev Neraksta #185 + Reinis Traidās

Ko Kursors Tev Neraksta #184

Ko Kursors Tev Neraksta #183 + Dāvids Rundelis (CellDrive)

Piedalies Kursors.lv konkursā un laimē “Xiaomi Oscillation Electric Toothbrush Pro” zobu birsti (noslēdzies)

Piedalies Kursors.lv konkursā un laimē “herQs Pin Pro” viedo gaļas termometru (noslēdzies)

Piedalies Kursors.lv konkursā un laimē Nothing Phone (2) Plus viedtālruni (noslēdzies)

Logitech MX ERGO datorpeles konkurss (noslēdzies)

Pat “Microsoft” apgalvo, ka MI čatboti kļūst dumjāki, ja ar tiem ilgi sarunājies

Jaunākie raksti

“Nvidia” un “Microsoft” pētnieki noskaidrojuši, ka mākslīgā intelekta aģentiem nerūp drošība un uzticamība

“Ferrari” savu jauno 600 tūkstošu dolāru vērto elektroauto “Luce” varētu triekt sienā

Hakeri nozaguši dažu “Dashlane” paroļu uzglabāšanas servisa lietotāju datus

“Samsung” demonstrē pasaulē pirmo 4K izšķirtspējas 360Hz atsvaidzes QD-OLED monitora paneli

“Microsoft” prezentē valkājamu mākslīgā intelekta palīgierīci “Project Solara”

Jaunākie komentāri