Menu
Geneea News
  • back to Geneea homepage
  • English
Geneea News

Projekt JEDI: Nový pohled na práci s rozhovory v moderních redakcích

Posted on 2026-01-262026-01-27

Pokud jste někdy vedli novinový rozhovor, určitě znáte ten okamžik, kdy se celá dynamika změní. Diktafon se vypne a vám zůstane jen dlouhý audiozáznam, neuhlazené přepisy a vědomí, že máte velmi málo času na to, abyste všechno co nejrychleji a nejpřesněji proměnili v článek.

Rozhovory jsou totiž nejen jedním z nejbohatších zdrojů původní žurnalistiky, ale jsou také formátem, jehož zpracování do publikovatelné podoby patří k těm nejnáročnějším. Z jediného hodinového rozhovoru lze vytvořit několik článků, následných textů a doprovodných boxů. To všechno však stojí na pečlivém přepisu, ověřování a editaci. Editoři musí být nejen rychlí, ale také konzistentní a schopni udržet kontrolu nad celým procesem.

Abychom vyzkoušeli, jak může automatizace tento proces podpořit, aniž by ohrozila redakční standardy, spojili jsme se se s italskou společností Atex a vytvořili projekt JEDI. Jeho cílem bylo pomoci převést neupravené nahrávky rozhovorů do strukturovaných, kvalitních návrhů článků, které přirozeně zapadnou do stávajících redakčních procesů.

Projekt je podpořen fondem FAIR EU Fund. Iniciativa FAIR je propagována italským Ministerstvem univerzit a výzkumu (MUR) a financována Evropskou unií prostřednictvím programu NextGenerationEU.

Co je JEDI

JEDI není jednoduchý přepisovací nástroj a není ani zamýšlen jako náhrada novinářů či editorů. Jeho úlohou je nahradit novináře při opakující se rutinní práci, která následuje po ukončení rozhovoru. Obvykle je totiž právě tato část tím, co brzdí publikační proces a odvádí pozornost od důležitějších redakčních činností.

Vedle doslovného přepisu systém vytváří strukturovaný návrh článku v téměř publikovatelné podobě. Návrh zůstává plně propojený s původním rozhovorem. Redakční úsudek však zůstává zásadní: výstup je určen k revizi, feedbacku a úpravám ze strany editorů.

Jedním z nejobtížnějších aspektů rozhovorů je jejich nelineární povaha. Respondenti přeskakují mezi tématy, vracejí se k dřívějším bodům a často rozvíjejí některé myšlenky až mnohem později v průběhu rozhovoru. JEDI je navržen tak, aby tuto realitu zvládal. Identifikuje témata napříč celou nahrávkou a sestavuje tematicky zaměřené sekce z různých částí daného rozhovoru.

Tento přístup také umožňuje vytvořit více článků z jednoho dlouhého rozhovoru, přičemž každý návrh se soustředí na jiné téma. V praxi to znamená, že dlouhý rozhovor o klimatické politice může sloužit jako zdroj článku o regulacích, článku o reakci průmyslu a do třetice článku zaměřeného na lokální dopady, aniž by editor musel tyto části ručně skládat dohromady.

V současnosti systém podporuje nahrávky o délce až 60 minut a typicky vytváří návrhy v rozsahu 2 000–3 000 slov. Návrhy článků lze přizpůsobit stylovým pravidlům konkrétní publikace tak, aby odpovídaly tónu a struktuře daného média a nedržely se pouze obecného formátu.

Přestože se dosavadní vývoj nástroje soustředil především na angličtinu, systém jsme testovali také na německých, českých a slovenských rozhovorech a s výsledky jsme byli velmi spokojeni.

Dohledatelnost, ověřování a redakční kontrola

Od samého začátku bylo jasné, že pro použití nástroje v redakci nestačí pouhá správnost informací. Editoři potřebují také rozumět tomu, odkud dané informace pocházejí a proč se v návrhu článku objevují. Tento požadavek měl vliv na klíčová rozhodnutí v průběhu navrhování systému. Každý odstavec v generovaném článku je propojen s původním přepisem a audiozáznamem. To editorům umožňuje rychle ověřit zmíněná tvrzení, zkontrolovat formulace a potvrdit kontext, aniž by museli procházet celé původní nahrávky.

Systém také zahrnuje automatizované ověřování faktů. Faktická tvrzení jsou nejprve kontrolována vůči samotnému přepisu rozhovoru a tam, kde je to relevantní, porovnávána s veřejně dostupnými informacemi. To samozřejmě nenahrazuje redakční fact-checking, ale pouze upozorňuje na potenciální problémy dříve. Jejich oprava je pak levnější a jednodušší.

Od audio souboru k editovatelnému návrhu

Na pozadí projekt JEDI využívá modulární agentickou architekturu, která kombinuje zpracování řeči, velké jazykové modely a redakční logiku. Pro uživatele v redakcích lze však workflow chápat ve třech přehledných krocích:

1. Fáze čištění přepisu

Proces začíná zlepšením kvality přepisu:

  • spojování roztříštěných vět vzniklých přirozenými řečovými vzorci
  • vyhlazování přerušení
  • oprava gramatických chyb a nesrozumitelných míst

Všechny změny jsou kontrolovány vůči původnímu přepisu, aby bylo zajištěno zachování významu a aby nebylo přidáno nic nového.

2. Fáze tvorby návrhu článku

Jakmile je přepis vyčištěný, vytváří se návrh článku:

  • návrh titulků
  • napsání úvodu
  • rozdělení obsahu do tematických sekcí
  • přiřazení mezititulků
  • rozdělení dlouhých či složitých odpovědí na kratší, čtivější části (někdy s využitím generovaných doplňujících otázek pro vytvoření lepší struktury)

Pokud návrh překročí stanovenou délku, méně podstatné pasáže jsou selektivně zkráceny, zatímco hlavní myšlenky zůstanou zachované.

3. Fáze revize a ověřování

Na konec přichází na řadu doladění a konzistence:

  • sjednocení terminologie
  • zpřesnění časových odkazů
  • kontrola článku po jednotlivých větách
  • propojení každého faktického tvrzení s rozhovorem a přímý přístup k přepisu i audiozáznamu, aby editoři mohli ověřit některé detaily před samotnou publikací

Jak se vyhodnocují nové přístupy

Vyhodnocování hraje ve vývoji projektu JEDI důležitou roli. Namísto spoléhání se jen na automatizované metriky náš tým pravidelně v průběhu testovací fáze porovnává různé verze téhož článku – například návrhy vytvořené různými jazykovými modely, konfiguracemi nebo po aktualizacích systému.

Pomocí automatizovaného přístupu „LLM jako hodnotitel“ se návrhy porovnávají mezi sebou a posuzují se podle jasně definovaných redakčních kritérií (srozumitelnost, konzistence hlasu, práce s odpověďmi z rozhovoru a terminologie). Evaluační nástroj pak vybere tu lepší verzi a přidá vysvětlení, jak k rozhodnutí dospěl.

Zatímco automatizace pomáhá s porovnáváním, novináři přezkoumávají vybranou část výsledků, aby validovali závěry a poskytli zpětnou vazbu. Kombinace automatizovaného porovnávání verzí a následné kontroly ze strany novinářů vede nejen k lepšímu porozumění, která verze systému je lepší, ale také proč tomu tak je.

Aktuální stav projektu

První fáze projektu JEDI je dokončena a systém je již použitelný v reálných redakčních procesech. V současné době se zaměřujeme na zvyšování přesnosti/správnosti, rozšiřování vícejazyčné podpory a zlepšování transparentnosti pro editory.

Explore Topics

  • Akce a události
  • Czech
  • Hlas zákazníka
  • Informace
  • Jak žije Geneea
  • Novinky o produktu
  • Partnerství
  • Příběhy zákazníků
  • Řešení pro média
  • Velké jazykové modely
  • Výzkum & inovace
  • Zmínili nás
  • Zpravodaj

Popular Posts

  • Jirka Hana o tom, proč je sémantické tagování pro vydavatele důležité
  • Projekt JEDI: Nový pohled na práci s rozhovory v moderních redakcích
  • Zpravodajství se stává osobnějším – a my také
  • The Hindu: přechod k automatizovanému sémantickému tagování
  • Jirka Hana na konferenci Primetime for Big Data
  • Akce a události
  • Czech
  • Hlas zákazníka
  • Informace
  • Jak žije Geneea
  • Novinky o produktu
  • Partnerství
  • Příběhy zákazníků
  • Řešení pro média
  • Velké jazykové modely
  • Výzkum & inovace
  • Zmínili nás
  • Zpravodaj
©2022 Geneea