Harmonogram

Etapa 1: Analytická a přípravná fáze

Cíle etapy: provést základní vstupní analýzu dat z webového archivu za účelem prozkoumání dat, konkrétně velikost dat, předpokládaný nárůst, dostupné formáty dat a samozřejmě konkretizace a formulace oblasti výzkumu. Výstupem první etapy je také přehledová studie o dostupnosti a využívání tzv. Big-data v sociálních vědách v ČR a Evropě.
Datum zahájení řešení etapy: 1. 3. 2018
Datum ukončení řešení etapy: 31. 12. 2018

Etapa 2: Hloubková analýza dat z Webarchivu

Cíle etapy: vytvoření pomocné datové a metadatové struktury, návrh databáze digitálních objektů, která umožní další práci se strukturovanými daty. V této etapě také začne vývoj analytických nástrojů a jejich následné testování na vzorcích dat vytvořených v první etapě. Analytické aplikace vzniknou pro dvě oblasti: sémantickou analýzu textu a zpracování audio souborů.
Datum zahájení řešení etapy: 1. 1. 2019
Datum ukončení řešení etapy: 31. 12. 2020

Etapa 3: Provoz softwarových nástrojů a jejich použití v aplikovaných vědeckých výstupech

Cíle etapy: vývoj centralizovaného rozhraní pro vytěžování velkých dat z webových archivů, vytvoření tří tematických studií, ve kterých budou využita data webového archivu a prezentace výsledků pro badatelskou komunitu.
Datum zahájení řešení etapy: 1. 1. 2021
Datum ukončení řešení etapy: 31. 12. 2022