Intelligente Data Cleansing tools

Data Cleansing, Validatie en Standaardisatie - ook voor uw organisatie

Het is gemakkelijk om informatie verkeerd in te voeren, maar het is uitermate moeilijk om vast te stellen of gegevens correct, eenduidig en compleet zijn.


"Wist u, dat er 47 manieren zijn om Amsterdam te spellen? Een van onze klanten kwam hier achter toen hij een rapport wilde draaien."


Human Inference levert data cleansing tools die er voor zorgen dat namen en adressen worden geschoond, gevalideerd en gestandaardisserd. Van Brazilië tot België, van India tot de Verenigde Staten, van Nederland tot Nepal....wereldwijd.
Bij de invoer van gegevens wilt u er zeker van zijn dat deze correct worden ingevoerd, onafhankelijk van het feit waar of wanneer ze worden ingevoerd. En wanneer de data eenmaal goed in het systeem staat, wilt u zorgen dat de data schoon blijft. En dat is nodig ook. Een voorbeeld: Gemiddeld 20% van alle e-mailadressen in databanken zijn niet correct en gemiddeld 5 % van alle namen die in webformulieren worden ingevoerd, zijn nepnamen.

De Data Cleansing functies van Human Inference dekken het volledige spectrum van contactinformatie af:

 
Name Worldwide:


nameNaamsuggesties. Validatie van namen en het vaststellen van de prevalente spellingsvarianten. Bepaling van het geslacht op basis van naamkenmerken. Dit zijn slechts enkele voorbeelden van de, op natuurlijke taalverwerking gebaseerde, data cleansing-mogelijkheden van HIquality Name Worldwide. Andere voorbeelden zijn het ontdekken van potentieel "verdachte" namen, zoals Mickey Mouse en James Bond. Deze namen bestaan uit valide naamselementen, maar in een specifieke combinatie duiden ze op het gebruik van nepnamen.

 

Address Worldwide:

 

addressWat is het juiste adresformaat voor een specifiek land? Inderdaad; in Ierland gebruikt men geen postcodes en in Frankrijk staat het huisnummer voor de straatnaam. Spaar portokosten door het gebruik van onze gecertificeerde data cleansing tools. HIquality Address Worldwide corrigeert en completeert onvolledige en onjuiste adressen en levert suggesties voor adressen die te weinig informatie bevatten om een adres eenduidig vast te stellen.


Email Worldwide:


emailIedereen weet dat een e-mailadres een @ en een domeinnaam moet bevatten. Maar hoe zit het met de validiteit van die domeinnaam? En hoeveel zekeheid geeft validiteit ten aanzien van het daadwerkelijk ontvangen van de e-mail? Hoewel geemail.com een bestaande domeinnaam is, is het waarschijnlijker dat hier gmail.com wordt bedoeld. Voor de data cleansing-producten van Human Inference hebben wen een tool ontwikkeld, dat validatie en suggestie van e-mailadressen genereert. Deze zijn gebaseerd op natuurlijke taalverwerking en statitische informatie over spellingsfouten in e-mailadressen. Tests wijzen uit, dat 60% van verkeerd gespelde domeinnamen op deze manier kunnen worden gecorrigeerd.

 

Telephone Worldwide:


telephoneWeet u voor welk land de landcode +91 is? Weet u of een telefoonnummer een vast of een mobiel nummer is en weet u wat het juiste aantal getallen voor een specifiek telefoonnummer? Met HIquality Telephone Worldwide weet u dat u het juiste nummer gebruikt. Daarnaast helpt dit data cleansing tool u om de eigenschappen van telefoonnummers vast te stellen (landcode, vast, mobiel) en kunt u het telefoonnummer in het gewenste formaat standaardiseren.


Numbers Worldwide:


NumberBij Zweedse sofinummers is het mogelijk om het geslacht van een persoon te detecteren. Nederlandse bankrekeningnummers hebben een specifiek formaat, dat dient ter validiteitscontrole. Met de data cleansing-mogelijkheden van HIquality Number kunt u geautomatiseerd nummers valideren, zodat u er zeker van kunt zijn dat de juiste nummers in de juiste processen worden gebruikt.

life-cycle cleanse