Úvod

Mezi hlavní cíle projektu patří aplikovaný výzkum a experimentální vývoj systému pro identifikaci, správu a zpracování širokého spektra dat českého webového archivu. Hlavním účelem je umožnit široké odborné veřejnosti využívat potenciálu dlouhodobě shromažďovaných dat. Ta jsou dosud z velké části nezpracovaná a tedy vědcům nepřístupná. Navrhovaný projekt propojuje oblast vytěžování velkých dat, tzv. Big-data z českého webového archivu a oblast výzkumu sociálněvědních oborů tzv. digital humanities. Cílem je vytvořit platformu pro badatelskou činnost nad celým spektrem dat pocházejících z českého webu s možností vyhledat, definovat a sdílet relevantní data na základě konkrétních potřeb badatele či odborné veřejnosti.

Centralizované rozhraní

Výstupem projektu budou nástroje a infrastruktura pro analýzu a interpretaci velkých objemů dat především v humanitních oborech. Hlavním cílem je usnadnit práci se zdroji.

Big-data pro vědu a výzkum

Aktuální trend ve světě vědy a výzkumu je využití velkých objemů dat a jejich metadat. To s sebou přináší nutné změny v postupech a práci s daty. Právě novým a možnostem na poli výzkumu se věnuje i projekt NAKI II.

Digital humanities

S přesunem stále více aktivit do prostředí internetu se i sociálněvědní obory orientují na digitální zdroje informací. Proto je vývoj platformy pro snazší přístup k digitálním dokumentům krokem k moderní vědě.

Sdílení a spolupráce

Všechny nově vyvinuté nástroje a software budou mít status open source, aby bylo možné na nich dále pracovat a do budoucna je zlepšovat.