Čo prezradí AI text na prvý pohľad
Keď si pozriete výstup väčšiny jazykových modelov pozorne, nájdete niekoľko opakujúcich sa vzorov. Nie preto, že by bol text gramaticky chybný. Práve naopak. Problém je v určitej mechanickej bezchybnosti, ktorá reálnemu textu nie je vlastná.
Medzi najfrekventovanejšie znaky patrí:
Generické formulácie bez konkrétneho obsahu. Vety ako „Je dôležité si uvedomiť, že...“ alebo „V dnešnej dobe je čoraz viac...“ nehovoria nič konkrétne. Sú to výplňové konštrukcie, ktoré AI používa preto, lebo sa podobajú na bežné akademické obraty.
Pravidlo trojice. AI má silnú tendenciu uvádzať veci v trojiciach: „Existujú tri hlavné dôvody: po prvé..., po druhé..., po tretí...“ Táto štruktúra sa objavuje tak konzistentne, že sama o sebe vzbudzuje podozrenie.
Nadmerné pomlčky a parentetické vsuvky. Veta ako „Tento jav, hoci sa to zdá paradoxné, je bežný v akademickom prostredí“ nie je sama o sebe zlá. Ale keď takých konštrukcií nájdete v texte osem na jednej strane, niečo nesedí.
Hladkosť bez drsnosti. Skutočný text má rytmus, ktorý sa mení. Niektoré vety sú kratšie. Iné sú dlhšie a komplikovanejšie, lebo autor rozmýšľal, ako niečo vysvetliť. AI generuje text s príliš rovnomerným tempom, čo paradoxne pôsobí umelo.
Tvrdenia bez zdroja. „Výskumy ukazujú, že...“ alebo „Odborníci sa zhodujú, že...“ bez jedného mena, roku ani odkazu. V záverečnej práci je to problém sám o sebe, bez ohľadu na to, kto text napísal.
Ako fungujú AI detektory
Nástroje ako Turnitin AI Detection, GPTZero alebo Copyleaks analyzujú text na základe dvoch hlavných signálov: perplexity (nepredvídateľnosť textu, keďže ľudský text je štatisticky menej predvídateľný) a burstiness (variabilita v dĺžke a komplexnosti viet, pretože ľudia píšu nerovnomerne).
Zjednodušene povedané: tieto nástroje sa pýtajú, nakoľko bol každý ďalší token textu „očakávateľný“ na základe predchádzajúceho kontextu. AI modely produkujú text, ktorý je štatisticky veľmi plynný, a práve to ich odhaľuje.
Turnitin, ktorý používajú tisíce univerzít vrátane mnohých slovenských, integroval AI detekciu od roku 2023. Zobrazuje percentuálny podiel textu označeného ako pravdepodobne AI-generovaný a prepája ho s nástrojom na kontrolu plagiátov.
Limity detektorov a falošné pozitíva
Tu je dôležité byť presný: AI detektory nie sú spoľahlivé na úrovni 100 % a nikdy to ani netvrdili.
Falošné pozitíva sa vyskytujú. Akademický text s formálnym štýlom, repetitívnou štruktúrou a terminologicky homogénnym jazykom môže byť označený ako AI, aj keď ho napísal človek. Obzvlášť zraniteľní sú:
- autori, ktorých materinský jazyk nie je jazyk práce,
- študenti s veľmi formálnym alebo vzorovo správnym prejavom,
- práce z technických odborov s opakujúcou sa terminológiou.
Zároveň platí, že dôkladne prepracovaný AI text môže detektorom prejsť bez záznamu. Žiadny detektor nie je definitívnym dôkazom.
Ako teda školy na to reagujú? Väčšinou nie automatickým vylúčením, ale ďalším pohovorom. Ak ste text napísali sami, ste schopní ho obhájiť, vysvetliť každú formuláciu a odpovedať na otázky k obsahu. Ak nie, a tu je jadro problému, ani detektor nepotrebujú.
Riziká, ktoré stoja za zmienku
Slovenské univerzity odkazujú na CRZP (Centrálny register záverečných, rigoróznych a habilitačných prác) a väčšinou majú internú smernicu o akademickej etike, ktorá explicitne zakazuje vytváranie textu prostredníctvom AI nástrojov bez riadneho označenia. Niektoré to majú ošetrené od roku 2023, iné aktualizujú pravidlá priebežne.
Priamy dôsledok pri odhalení závisí od školy a závažnosti situácie, od opravy práce až po disciplinárne konanie. V prípade záverečnej práce, kde ide o obhajobu pred komisiou, je riziko najvyššie. Komisia môže klásť otázky k akémukoľvek odseku. Ak študent text neovláda, je to viditeľné bez akéhokoľvek detektora.
Prečo je vlastný text alebo ľudský podklad výhodnejší
Nie je to len o etickom princípe, hoci ten má svoju váhu. Je to aj praktická záležitosť.
Keď píšete vlastnými slovami, aj nepresne a s opravami, rozumiete tomu, čo ste napísali. Viete obhájiť metodologické rozhodnutia. Viete vysvetliť, prečo ste zvolili konkrétny prístup. To je presne to, čo sa na obhajobe preveruje.
Ak vám niekto pripraví podklady, teda štruktúrovaný prehľad literatúry, faktografický základ, osnovu kapitol, pracujete s materiálom, nie s hotovým textom. Výsledný text je váš, pretože vy ste ho napísali. Ľudský autor v pozícii konzultanta alebo asistenta výskumu je legitímna a bežná prax na mnohých zahraničných univerzitách.
Práve to robíme v Ghostwriting4U pri záverečných prácach: pripravíme vám podklady, osnovu, prehľad zdrojov a faktografický základ. Výsledný text píšete vy. A to je rozdiel, ktorý obstojí aj pred komisiou.
Ak riešite bakalársku prácu, pozrite si aj naše podklady pre bakalárske práce.
Čo si z toho odniesť
AI detektory sú skutočné a školy ich nasadzujú. Nie sú neomylné, keďže falošné pozitíva existujú a prepracovaný AI text nimi môže prejsť. Ale spoľahnúť sa na túto medzeru je hazard, nie stratégia.
Najspoľahlivejšia ochrana je text, ktorý skutočne poznáte. Taký vznikne, keď pracujete s dobrými podkladmi a píšete sami, prípadne keď ľudský odborník stojí za výskumnou prácou, nie za konečnou formuláciou.
