Intelligente Data Cleansing tools
Data Cleansing, Validatie en Standaardisatie - ook voor uw
organisatie
Het is gemakkelijk om informatie verkeerd in te voeren, maar het
is uitermate moeilijk om vast te stellen of gegevens correct,
eenduidig en compleet zijn.
"Wist u, dat er 47 manieren zijn om Amsterdam te spellen? Een van
onze klanten kwam hier achter toen hij een rapport wilde
draaien."
Human Inference levert data cleansing tools die er voor zorgen dat
namen en adressen worden geschoond, gevalideerd en
gestandaardisserd. Van Brazilië tot België, van India tot de
Verenigde Staten, van Nederland tot Nepal....wereldwijd.
Bij de invoer van gegevens wilt u er zeker van zijn dat deze
correct worden ingevoerd, onafhankelijk van het feit waar of
wanneer ze worden ingevoerd. En wanneer de data eenmaal goed in het
systeem staat, wilt u zorgen dat de data schoon blijft. En dat is
nodig ook. Een voorbeeld: Gemiddeld 20% van alle
e-mailadressen in databanken zijn niet correct en gemiddeld 5 % van
alle namen die in webformulieren worden ingevoerd, zijn
nepnamen.
De Data Cleansing functies van Human Inference dekken het
volledige spectrum van contactinformatie af:
Name Worldwide:
Naamsuggesties. Validatie van
namen en het vaststellen van de prevalente spellingsvarianten.
Bepaling van het geslacht op basis van naamkenmerken. Dit zijn
slechts enkele voorbeelden van de, op natuurlijke taalverwerking
gebaseerde, data cleansing-mogelijkheden van HIquality Name
Worldwide. Andere voorbeelden zijn het ontdekken van potentieel
"verdachte" namen, zoals Mickey Mouse en James Bond. Deze namen
bestaan uit valide naamselementen, maar in een specifieke
combinatie duiden ze op het gebruik van nepnamen.
Address Worldwide:
Wat is het juiste
adresformaat voor een specifiek land? Inderdaad; in Ierland
gebruikt men geen postcodes en in Frankrijk staat het huisnummer
voor de straatnaam. Spaar portokosten door het gebruik van onze
gecertificeerde data cleansing tools. HIquality Address
Worldwide corrigeert en completeert onvolledige en onjuiste
adressen en levert suggesties voor adressen die te weinig
informatie bevatten om een adres eenduidig vast te
stellen.
Email Worldwide:
Iedereen weet dat een
e-mailadres een @ en een domeinnaam moet bevatten. Maar hoe zit het
met de validiteit van die domeinnaam? En hoeveel zekeheid geeft
validiteit ten aanzien van het daadwerkelijk ontvangen van de
e-mail? Hoewel geemail.com een bestaande domeinnaam is, is het
waarschijnlijker dat hier gmail.com wordt bedoeld. Voor de data
cleansing-producten van Human Inference hebben wen een
tool ontwikkeld, dat validatie en suggestie van
e-mailadressen genereert. Deze zijn gebaseerd op natuurlijke
taalverwerking en statitische informatie over spellingsfouten in
e-mailadressen. Tests wijzen uit, dat 60% van verkeerd gespelde
domeinnamen op deze manier kunnen worden gecorrigeerd.
Telephone Worldwide:
Weet u voor welk land de
landcode +91 is? Weet u of een telefoonnummer een vast of een
mobiel nummer is en weet u wat het juiste aantal getallen voor een
specifiek telefoonnummer? Met HIquality Telephone Worldwide weet u
dat u het juiste nummer gebruikt. Daarnaast helpt dit data
cleansing tool u om de eigenschappen van telefoonnummers vast te
stellen (landcode, vast, mobiel) en kunt u het telefoonnummer in
het gewenste formaat standaardiseren.
Numbers Worldwide:
Bij Zweedse sofinummers is
het mogelijk om het geslacht van een persoon te detecteren.
Nederlandse bankrekeningnummers hebben een specifiek formaat, dat
dient ter validiteitscontrole. Met de data cleansing-mogelijkheden
van HIquality Number kunt u geautomatiseerd nummers valideren,
zodat u er zeker van kunt zijn dat de juiste nummers in de juiste
processen worden gebruikt.