Data and Process Quality Evaluation in a Textual Big Data Archiving System

Fugini, M.; Finocchi, J.

doi:10.1145/3461015

The article presents a textual Big Data analytics solution developed in a real setting as a part of a high-capacity document digitization and storage system. A software based on machine learning techniques performs automated extraction and processing of textual contents. The work focuses on performance and data confidence evaluation and describes the approach to computing a set of indicators for textual data quality. It then presents experimental results.

Data and Process Quality Evaluation in a Textual Big Data Archiving System

M. Fugini;J. Finocchi

2021-01-01

Abstract

The article presents a textual Big Data analytics solution developed in a real setting as a part of a high-capacity document digitization and storage system. A software based on machine learning techniques performs automated extraction and processing of textual contents. The work focuses on performance and data confidence evaluation and describes the approach to computing a set of indicators for textual data quality. It then presents experimental results.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno di pubblicazione
	
				2021
			
	Titolo della rivista
	
				ACM JOURNAL ON COMPUTING AND CULTURAL HERITAGE
			
	Parole chiave
	
				Textual Big Data, Machine Learning, Smart Companies, Digital Innovation in SME
			
	Appare nelle tipologie:
	
				01.1 Articolo in Rivista

File in questo prodotto:

File	Dimensione	Formato
JOCCH_R2.pdf Accesso riservato Descrizione: Articolo Principale : Publisher’s version Dimensione 1.2 MB Formato Adobe PDF Visualizza/Apri	1.2 MB	Adobe PDF	Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11311/1308799

Citazioni

ND

1

2

ND

RE.PUBLIC@POLIMI pubblicazioni di ricerca del Politecnico di Milano

Data and Process Quality Evaluation in a Textual Big Data Archiving System

M. Fugini;J. Finocchi

2021-01-01

Abstract

Scheda breve

Scheda completa

Scheda completa (DC)

Citazioni

social impact

RE.PUBLIC@POLIMI pubblicazioni di ricerca del Politecnico di Milano

Data and Process Quality Evaluation in a Textual Big Data Archiving System

M. Fugini;J. Finocchi

2021-01-01

Abstract

Scheda breve Scheda completa Scheda completa (DC)

Informazioni

Citazioni

social impact

Conferma cancellazione

Scheda breve

Scheda completa

Scheda completa (DC)