Wanneer u tabelkolommen samenvoegt, hebt u geen exacte overeenkomst meer nodig. Met fuzzy matching kunt u items in afzonderlijke lijsten vergelijken en toevoegen als ze vergelijkbaar zijn. U kunt de drempelwaarde voor overeenkomsten instellen om de overeenkomende tolerantie aan te passen.
Een veelvoorkomend gebruiksvoorbeeld voor fuzzy matching is met vrije tekstvelden, zoals in een enquête, waar antwoorden typefouten, enkelvouds, meervouds, hoofdletters, kleine letters en andere variaties kunnen bevatten.
Fuzzy matching wordt alleen ondersteund bij samenvoegbewerkingen voor tekstkolommen. Power Query gebruikt het jaccard-gelijkenis-algoritme om de gelijkenis tussen paren van exemplaren te meten.
Procedure
-
Als u een query wilt openen, zoekt u er een die eerder is geladen vanuit de Power Query-editor, selecteert u een cel in de gegevens en selecteert u vervolgens Query > Bewerken. Zie Een query maken, bewerken en laden in Excel (Power Query) voor meer informatie.
-
Selecteer Start > Query's > samenvoegencombineren. U kunt ook Query's samenvoegen selecteren als Nieuw. Het dialoogvenster Samenvoegen wordt weergegeven met de primaire tabel bovenaan.
-
Selecteer de kolom die u wilt gebruiken voor de fuzzy-overeenkomst. In dit voorbeeld selecteren we Voornaam.
-
Selecteer in de vervolgkeuzelijst de secundaire tabel en selecteer vervolgens de bijbehorende fuzzy-overeenkomstkolom. In dit voorbeeld selecteren we Voornaam.
-
Selecteer een jointype. Er zijn verschillende manieren om deel te nemen. Left Outer is de standaardinstelling en de meest voorkomende. Zie Query's samenvoegen voor meer informatie over elk type join.
-
Selecteer Fuzzy-overeenkomsten gebruiken om de samenvoeging uit te voeren, selecteer Fuzzy-overeenkomende opties en selecteer vervolgens een van de volgende opties:
-
Drempelwaarde voor overeenkomsten Geeft aan hoe vergelijkbaar twee waarden moeten zijn om overeen te komen. De minimumwaarde van 0,00 zorgt ervoor dat alle waarden overeenkomen met elkaar. De maximale waarde van 1,00 staat alleen exacte overeenkomsten toe. De standaardwaarde is 0,80.
-
Case negeren Geeft aan of tekstwaarden moeten worden vergeleken op een hoofdlettergevoelige of ongevoelige manier. Het standaardgedrag is niet hoofdlettergevoelig, wat betekent dat case wordt genegeerd.
-
Maximum aantal overeenkomsten Hiermee bepaalt u het maximum aantal overeenkomende rijen dat wordt geretourneerd voor elke invoerrij. Als u bijvoorbeeld slechts één overeenkomende rij voor elke invoerrij wilt vinden, geeft u de waarde 1 op. Het standaardgedrag is om alle overeenkomsten te retourneren.
-
Transformatietabel Geef een andere query op die een toewijzingstabel bevat, zodat sommige waarden automatisch kunnen worden toegewezen als onderdeel van de overeenkomende logica. Als u bijvoorbeeld een tabel met twee kolommen definieert met een van- en naar-tekstkolommen met de waarden Microsoft en MSFT, worden deze twee waarden als hetzelfde beschouwd (overeenkomstscore van 1,00).
-
-
Power Query analyseert beide tabellen en geeft een bericht weer over het aantal overeenkomsten. In het voorbeeld komt de selectie overeen met 3 van 4 rijen uit de eerste tabel. Zonder fuzzy matching zouden slechts 2 van de vier rijen overeenkomen.
-
Als u tevreden bent, selecteert u OK. Zo niet, probeer dan verschillende Fuzzy-samenvoegopties om uw ervaring aan te passen.
-
Als u tevreden bent, selecteert u OK.
Zie ook
Help voor Power Query voor Excel