Publié par : pintejp | avril 7, 2016

Big Data / Panama Papers : déduplication et OCR pour donner du sens à l’énorme masse de données

Indexer et analyser 2,6 To de données non structurées n’a pas été une mince affaire. C’était pourtant le sous-jacent technique des révélations du Panama Papers. Le point sur les techniques utilisées.

http://www.zdnet.fr/actualites/big-data-panama-papers-deduplication-et-ocr-pour-donner-du-sens-a-l-enorme-masse-de-donnees-39835136.htm


Laisser un commentaire

Catégories