data quality
-
Typologie des anomalies, un cadre pour l’action : le cas du machine learning
Posted on
by
La qualité d’une donnée désigne son adéquation aux usages et objectifs visés (« fitness for use ») (Boydens, 1999, Boydens 2014). Dans cet article nous allons voir comment une typologie rigoureuse des anomalies offre un cadre pour l’amélioration de la qualité des données, dans de nombreux domaines, dont le machine learning.
-
Machine Learning : data quality challenges in the scope of a “fitness for use” (ULB, 18/05/22, 14h, on line)
Posted on
by
La prochaine journée FNRS “Analyse critique et amélioration de la qualité de l’information numérique” aura lieu le 18 mai de 14h à 15h30 en mode on line. Le thème cette année, « Apprentissage automatique (ML) : les challenges de la qualité des données dans la perspective d’une adéquation aux usages », sera présenté par Laurence Dierickx, qui a réalisé sa
-
Data Quality Tools : retours d’expérience et nouveautés
Posted on
by
Isabelle Boydens(*), Isabelle Corbesier(**) et Gani Hamiti(**) (*) Data Quality Expert, Research Team (**) Data Quality Analyst, Databases Team La problématique de la qualité des données (ou “fitness for use“, adéquation aux usages) est maintenant reconnue au plan international comme étant un facteur de succès à prendre en compte dans tout projet impliquant des bases
-
“Knowledge Management & Data Quality” (FNRS on line Meeting, ULB, 12/05/2021)
Posted on
by
La prochaine réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique » se tiendra le mercredi 12 mai 2021 de 14H à 15H30, elle aura lieu en ligne (vous recevrez le lien afin de rejoindre l’événement, une fois inscrits, voir ci-dessous). Pluridisciplinaire, le groupe se situe au confluent des sciences appliquées et des sciences humaines et
-
Data Quality : “Anomalies & Transactions Management System” (ATMS), prototype & “work in progress”
Posted on
by
Cet article a été mis à jour le 20 novembre 2024.. En 2019, nous annoncions un Proof of Concept relatif à la mise en place ultérieure d’un service générique d’ATMS (Anomalies & Transactions Management System). Nous en rappelons ici les principales motivations en termes de Data Quality et de ROI, illustrées sur la base de use cases ainsi que les spécifications…
-
Data Quality: “Anomalies & Transactions Management System” (ATMS), prototype & “work in progress”
Posted on
by
Dit artikel werd bijgewerkt op 20 november 2024. In 2019 kondigden we een Proof of Concept aan voor de latere invoering van een generieke ATMS service (Anomalies & Transactions Management System). We halen hier opnieuw de voornaamste redenen aan op het vlak van Data Quality en ROI, aangetoond met use cases alsook de functionele specificaties. Vervolgens gaan we van daaruit over op de technische voortgang en bespreken we de verdere…
-
Géocodage : contourner les lacunes d’OpenStreetMap (partie 2)
Posted on
by
Dans notre article précédent, nous présentions les difficultés que nous avons rencontrées dans notre tentative de géocoder (convertir une adresse en coordonnées géographiques, et standardiser cette adresse) avec Nominatim, le géocodeur d’OpenStreetMap. Nous avons aussi évoqué qu’en modifiant légèrement les adresses que Nominatim n’avait par reconnues, elles le devenaient. Nous avons considéré un ensemble de
-
Géocodage : contourner les lacunes d’OpenStreetMap (partie 1)
Posted on
by
Pour divers clients, nous avons été à la recherche d’une solution permettant de nettoyer (standardiser) des adresses postales, principalement en Belgique. Nous avions besoin d’une solution « on-premise », idéalement en Open-Source. Nous avons voulu construire une solution basée sur OpenStreetMap, qui permettait de rencontrer ces deux contraintes. Mais il s’est vite avéré qu’OpenStreetMap n’était
-
« I want to talk to a HUMAN! » : impact de la qualité des bases de connaissances sur les chatbots (29/01/2020, ULB)
Posted on
by
Rencontre « Data quality » FNRS-ULB-Smals le 29/01/2020 à l’Université libre de Bruxelles La prochaine réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique » se tiendra le mercredi 29 janvier 2020 dès 13h30 à l’Université libre de Bruxelles (auditoire AY2.108, bâtiment A, campus du Solbosch). Pluridisciplinaire, le groupe se situe au confluent des sciences
-
Data quality : mesurer la similarité interne
Posted on
by
Dans notre article précédent, nous présentons une méthode permettant de mesurer et visualiser l’importance des valeurs rares dans une liste de données où l’on s’attend à une grande redondance, souvent signes d’un problème de qualité. La méthode en question se basait uniquement sur un comptage des occurrences des valeurs, sans du tout en examiner le
Keywords:
AI analytics artificial intelligence blockchain chatbot coding computational creativity cryptography Cybersecurity data quality Data Quality Tools development EDA Event gdpr GIS governance Graph Databases Knowledge Graph Machine Learning Master Data Management Natural Language Processing Open Source Privacy Privacy by design pseudonymisation quantum computing Security software design source code






