Minulý týden mluvil náš Jiří Hana na konferenci FIBEP Tech Day o praktických výzvách při budování RAG systémů pro zpravodajská média a společnosti monitorující média.





RAG pro monitoring zpráv je úplně jiná káva než typické příklady z tutoriálů. Pracuje dr s datasety o velikosti stovek milionů nebo dokonce miliard článků.
Tady je pár věcí, které jsme se v Geneee naučili:
- Chytré filtrování: Použití filtrů nad metadaty a pojmenovanými entitami pro zúžení datasetu podstatně zvyšuje kvalitu. Uživatelé to však málokdy dělají ručně, takže filtry odvozujeme automaticky.
- Přesnost je důležitější než styl: Pro pokročilé uživatele jsou správnost a jasné uvedení zdroje mnohem důležitější než to, jak pěkně je odpověď napsaná.
- Atribuce: Nejde jen o to, co bylo řečeno, ale i o to, kdo to řekl – rozlišujeme mezi novinářem, médiem a citovaným politikem.
Pro ty, které zajímají technické detaily, jsou zde k dispozici slajdy. Jde však jen o shrnutí – to nejzajímavější se odehrálo během živých diskusí.
Turistika na Tenerife
Tenerife je také skvělým místem pro túry: můžete zdolat Teide (nejvyšší horu Španělska), prozkoumat okolní „měsíční“ krajinu, deštný prales na severu nebo navštívit vesnici Masca – takové „Machu Picchu“ Tenerife na jihu.



