Novinky

ČTK nasazuje další automaticky generované zprávy – po cenách benzinu brzy i statistiky nehod

17.06.2020

ČTK začala v těchto dnech pravidelně používat automaticky generované texty ve zpravodajství o cenách benzinu. Na přelomu června a července se chystá zautomatizovat i tvorbu zpráv o měsíčních statistikách dopravních nehod. Robotizace pomáhá redaktorům odbourávat rutinní práci, zpravodajství se tím zrychluje a omezuje se riziko chyb při přepisování dat, uvedla dnes na Novinářském fóru v pražském Karlíně šéfredaktorka zpravodajství ČTK Radka Matesová Marková.

ČTK poprvé využila automaticky generované zprávy během komunálních a senátních voleb v roce 2018, kdy vydala na 200 takovýchto textů. Národní tisková agentura se tak na poli robotické žurnalistiky stala průkopníkem mezi českými médii. Nástroje na automatickou tvorbu textů agentura vyvíjí ve svém IT oddělení ve spolupráci s redakcí. Spolupracuje přitom s firmou Geneea Analytics.

Všechny generované texty ČTK kontrolují a případně dále upravují editoři. Automaticky generované zprávy označuje ČTK ve svém zpravodajském servisu signaturou rur podle slavné hry Karla Čapka, ve které se poprvé objevilo slovo robot.

"Už při prvním testu na ceny benzinu se ukázalo, že díky automatickému generování textů vydáváme celý zpravodajský seriál asi o 40 minut rychleji než obvykle. Pakliže se systém ukáže jako spolehlivý a odhodláme se v první verzi tyto zprávy vydávat automaticky, měli by je klienti ČTK k dispozici bezprostředně poté, co budou na webu CCS publikovány – tedy kompletní seriál o dvě hodiny dříve, než tomu bylo dosud," uvedla šéfredaktorka.

Robotickou žurnalistikou v podmínkách tiskové agentury se obvykle rozumí systém, který na základě dat dostupných z nějakého datového zdroje (např. ČSÚ) nebo kombinace více zdrojů dokáže generovat textové zprávy v běžném jazyce. Tyto zprávy mohou být automaticky přímo vydávány nebo mohou být předány editorovi k dalšímu zpracování.

"Právě u zpráv o cenách pohonných hmot uvažujeme dokonce výhledově o tom, že by toto mohl být první případ, kdy automaticky tvořené zprávy budou v základní verzi vycházet bez zásahu editora," uvedla Matesová Marková s tím, že novináři by pak připravovali až rozšířenou verzi zprávy. Rozhodnutí, zda zprávy vydávat bez kontroly editorem, bude podle ní zásadní a bude záviset na dlouhodobém testování spolehlivosti systému v ostrém provozu. Automaticky generované zprávy lze v budoucnu připravit i u dalších pravidelně publikovaných statistických dat – např. vývoji HDP, inflace, o výsledcích turistiky, průmyslu či stavebnictví.

Automaticky generované texty využila letos ČTK interně i v prvních týdnech koronavirové krize. IT oddělení ČTK připravilo společně s redakcí na headliny a fleše jednoduché šablony, které zpracovávaly statistická data z webu ministerstva zdravotnictví.

"Tady nám ve finále ale rur posloužil spíš jako upozornění. Vzhledem k dynamice vývoje totiž nešlo pokaždé psát zprávy stejně, šablonovitost se tudíž poměrně brzy ukázala jako nevhodná cesta," vysvětlila šéfredaktorka. I tak ale automatické zpracování dat ministerstva zdravotnictví pomohlo editorům - krátký podkladový text, který program generoval, se při změnách údajů přenášel do redakčního systému ČTK, kde s ním dál pracovali redaktoři.

Četkařští redaktoři už několik měsíců testují také generátor burzovního zpravodajství vyvinutý v rámci výzkumného projektu Fakulty sociálních věd UK, ČVUT a Západočeské univerzity Plzeň. "Práce na naší straně zastavil koronavirus, opět se k němu ale vrátíme," uvedla šéfredaktorka ČTK.

Kromě tvorby jednodušších šablon se ČTK zapojuje i do vývoje pokročilého generování dat na základě statistického zpracování textů. Mnohdy ale IT specialisté narážejí na složitosti češtiny. "Čeština je nejen složitý, ale také malý jazyk a pro strojové učení není často k dispozici dostatečný objem vhodných textů. Nestačí nám ani obsah Infobanky ČTK," upozornila šéfredaktorka.

Další novinky