Když novinář píše článek, nejvíc práce mu zabere hledání informací. Zjišťování dodatečného kontextu, dohledávání a vypisování čísel, ověřování doplňkových faktů a další drobnosti ve výsledku trvají u každého článku několik hodin a znatelně ukrajují redaktorům z času určeného pro detailní analýzy, rozhovory nebo reportáže.
Měsíčně tak redakce stráví stovky, možná až tisíce hodin.
Díky nástupu AI se mnozí redaktoři nebo editoři obracejí na velké jazykové modely (LLM). Jenže ty často nevědí, co se stalo dnes ráno nebo včera, a většinou nerozlišují kvalitu zdrojů. Konzultovat s nimi styl nebo pravopis tak novináři sice mohou, ale ověřovat přes velké jazykové modely fakta, nebo je nechat dokonce nějakou část článku napsat je vysoce riskantní.
Naštěstí existuje řešení, které přiměje velký jazykový model chovat se tak, jak novináři potřebují. Jmenuje se RAG a jde o základ chytrého rešeršního systému, který využije každá redakce.
Co je RAG?
- Retrieval-Augmented Generation (RAG) v češtině znamená načítání rozšířené generace.
- Tento systém doplňuje velký jazykový model o vybranou databázi informací. Když uživatel položí otázku, RAG nejdříve v databázi vyhledá relevantní informace a na jejich základě pak LLM odpoví.
- RAG může například spolupracovat s vašim archivem. Vyhledává tedy jen v ověřených a kvalitních textech, které jste sami publikovali.
- LLM se stará hlavně o čtení, psaní a přemýšlení. Za správnost faktů ručí RAG.
- Odpovědi mohou být v různých formách: od jedné věty přes rozsáhlou rešerši s odkazy na zdroje až po odpověď ve formě příspěvku publikovatelného na sociální síti.
- Systém významně snižuje halucinování velkých jazykových modelů tím, že jim zabrání čerpat ze špatných zdrojů nebo poskytovat chybné/generické odpovědi v případech, kdy model nemá lepší informace.
Tip: Podobný fact box by systém založený na RAG uměl vygenerovat z vašeho archivu automaticky.
RAG vám umožní prohledat archiv všech vašich článků, zjistit, co všechno jste k tématu dosud napsali, a s pomocí daných informací vytvořit přesně to, co mu zadáte. Jirka Hana, co-founder Geneey, vysvětluje:
„Představte si, že novinář má psát o novém vývoji nějakého dlouhotrvajícího tématu. Například politického skandálu, ozbrojeného konfliktu nebo kontroverzního stavebního projektu. Než ale začne, musí si toho opravdu hodně nastudovat. Rešeršní nástroj postavený na RAG mu to velmi usnadní.
Kdy se objevily první informace o dané události? To naše AI zjistí z pět let starého článku. O co se vlastně jedná? AI najde odpověď v podrobné analýze publikované vaší redakcí v loňském roce. Jaké stanovisko zastávají hlavní aktéři? To bude obsaženo v rozhovoru s nimi.
Náš systém všechny informace shrne, případně je rovnou vloží do článku jako box s doplňkovými informacemi nebo jako časovou osu.”
Jirka o našem výzkumu a vývoji RAG přednášel také na loňských CUE Days v Berlíně a moderoval k tomuto tématu panel na Data Science Day pořádaný organizací WAN-IFRA.

RAG nebo jeho komponenty lze ale využít jako součást mnoha dalších produktů a řešení:
- automatické přiřazování souvisejících článků,
- asistence s ověřováním externích zdrojů, jako jsou například tiskové zprávy,
- výroba a aktualizace stránek pro klíčová slova, včetně automaticky generovaného popisku.
Zaujalo vás některé ze zmíněných využití RAG pro redakční práci? Chcete se zeptat na možnost implementace podobného nástroje do vašeho systému nebo objednat odbornou konzultaci? Napište nám a společně vymyslíme řešení na míru podle vašich potřeb.