Software pro generování textu ze zadaných informací
Zpracovat větší množství textu a extrahovat z něj maximum informace v minimálním výsledném textu je úkol, jehož vyřešení má potenciál ušetřit velké množství lidského času.
Analýza funkčních požadavků
Hlavním cílem systému je spojovat informace z více zdrojů do jednoho celku. Důležitým požadavkem na takto vzniklý celek je, aby obsahoval pokud možno všechnu relevantní informaci z podkladové kolekce a nedocházelo tedy k vypouštění důležitých částí.
Z tohoto pohledu se nabízí užití metod extraktivní sumarizace. Ty prezentují zdrojové části textu přímo, bez parafrází, které v sobě nebezpečí ztráty nebo změny významu obsahují.
Předpokládá se značná doménová různorodost zpracovávaných kolekcí a různorodost informačních potřeb uživatelů, kterou má předkládaný systém pokrýt. Je tedy vhodné, aby měl uživatel možnost postupně ovlivňovat složení výstupu podle své aktuální situace. Tento požadavek je v současné době mimo možnosti klasického end-2-end neuronového systému a vede k nutnosti hledat alternativu.
Požadavkem společným pro celý projekt je pak schopnost pracovat s vícejazyčnými textovými kolekcemi.
Systém má být jako samostatná komponenta začlenitelná do MASAPI Asistenta i do dalších produktů třetích stran.
Výsledky
datum realizace: srpen 2023
podrobné informace naleznete zde (pdf 561 kB)