Microsoft Excel ist ein vielseitiges Werkzeug, das häufig für die Arbeit mit Daten verwendet wird. Eine der am häufigsten vorkommenden Aufgaben besteht darin, Zeichenfolgen zu vergleichen, um ihre Ähnlichkeit zu bestimmen. In solchen Fällen ist es nicht immer möglich, einfach den Vergleichsoperator "gleich" zu verwenden. Zum Beispiel, wenn Zeichenfolgen Tippfehler, Mehrdeutigkeiten oder überflüssige Zeichen enthalten.
In solchen Situationen wird oft ein unscharfer Vergleich verwendet, mit dem Sie den Grad der Ähnlichkeit zweier Strings bestimmen können. Dies ist besonders nützlich, wenn es wichtig ist, ähnliche Zeilen zu finden, auch wenn sie nicht vollständig übereinstimmen.
Es gibt mehrere Methoden in Excel, um Zeichenfolgen unscharf zu vergleichen. Eine davon ist die Verwendung der Funktion "VERGLEICH".BEWEGUNG." Es ermöglicht Ihnen, zwei Zeilen zu vergleichen und ein Ergebnis als Zahl zu erhalten, die den Grad der Ähnlichkeit der Zeilen angibt. Je kleiner die Zahl ist, desto ähnlicher sind die Zeilen.
Eine weitere Option zum Fuzzy-Vergleichen von Zeilen in Excel besteht darin, den Filter "Die drei nächsten Zeilen" zu verwenden. Es analysiert die Zeilen in der Tabelle und findet basierend auf ihrer Ähnlichkeit die drei nächsten Zeilen der angegebenen Zeile.
Excel: Vergleichen von Zeilen mit einem Fuzzy-Vergleich
Das Vergleichen von Zeichenfolgen in Excel kann schwierig sein, insbesondere wenn Tippfehler oder verschwommenes Schreiben vorliegen. Sie können einen Fuzzy-Zeichenfolgenvergleich verwenden, um dieses Problem zu beheben.
Durch den Fuzzy-Vergleich von Zeilen in Excel können Sie ähnliche Zeilen finden, auch wenn sie unterschiedliche Tippfehler oder geringfügige Unterschiede aufweisen. Dies ist beispielsweise sehr nützlich, wenn Sie eine Kontaktliste oder eine Datenbank auf doppelte oder ähnliche Einträge vergleichen.
Sie können Funktionen verwenden, um einen Fuzzy-Zeilenvergleich in Excel durchzuführen, z. B. VLOOKUP, INDEX und MATCH. Um diese Funktionen jedoch unscharf zu machen, müssen Sie zusätzliche Parameter hinzufügen oder andere Funktionen verwenden, z. B. FIND oder SEARCH.
Wenn Sie beispielsweise zwei Zeilen vergleichen möchten, können Sie die Funktion verwenden FIND, um übereinstimmende Zeichen zu finden. Dann können Sie die Anzahl der übereinstimmenden Zeichen berechnen und sie mit dem Schwellenwert vergleichen. Wenn die Anzahl der übereinstimmenden Zeichen größer als der Schwellenwert ist, sind die Zeichenfolgen einander ähnlich.
Eine andere Möglichkeit, Strings mit einem Fuzzy-Vergleich in Excel zu vergleichen, besteht darin, eine phonetische Funktion zu verwenden SOUNDEX. Funktion SOUNDEX konvertiert eine Zeichenfolge in einen Satz von phonetischen Codes, die verglichen werden können. Wenn also zwei Zeilen ähnliche phonetische Codes haben, werden sie als ähnlich angesehen.
In beiden Fällen ist das Ergebnis ein boolescher Wert: TRUE oder FALSE, der angibt, ob die Zeichenfolgen einander ähnlich sind.
Daher ist ein Fuzzy-Zeilenvergleich in Excel sehr nützlich, wenn Sie mit großen Datenlisten arbeiten oder wenn Sie ähnliche Datensätze schnell finden müssen. Es ermöglicht Ihnen, doppelte oder ähnliche Zeichenfolgen zu erkennen, auch wenn sie unterschiedliche Tippfehler oder geringfügige Unterschiede aufweisen.
Was ist ein Fuzzy-Vergleich
Ein Fuzzy-Vergleich ist eine Methode zum Vergleichen von Strings, die darauf basiert, den Grad ihrer Ähnlichkeit und nicht der Identität zu bestimmen. Wenn wir Strings mit einer Fuzzy-Methode vergleichen, berücksichtigen wir die Möglichkeit von Tippfehlern, verschiedenen Variationen der Schreibweise von Wörtern sowie ähnlicher Phonetik.
Dieser Ansatz zum Vergleich von Strings ist besonders nützlich, wenn wir eine große Menge an Informationen haben und ähnliche Strings schnell finden oder Duplikate unter ihnen finden müssen. Ein Fuzzy-Vergleich ermöglicht es uns, die Zeit und den Aufwand zu reduzieren, den wir für die manuelle Überprüfung jeder Zeile aufwenden würden.
Durch die Verwendung von Fuzzy-Vergleichsalgorithmen in Excel können Sie Zeichenfolgen mit verschiedenen Schreibvarianten, Tippfehlern und sogar Synonymen vergleichen. Dadurch können wir Strings erkennen, die visuell schwer voneinander zu unterscheiden sind, aber in Bezug auf einen unscharfen Vergleich als gleich angesehen werden.
Wann sollte ich einen Fuzzy-Vergleich in Excel verwenden
Die Verwendung eines Fuzzy-Vergleichs kann in folgenden Fällen sinnvoll sein:
1. Duplikate finden
Ein Fuzzy-Vergleich zeigt doppelte Zeichenfolgen an, die kleine Unterschiede wie Tippfehler, Abkürzungen oder Schreibweisen enthalten können. Solche Duplikate können fehlerhafte Datensätze oder doppelte Daten sein, die eine zusätzliche Verarbeitung erfordern.
2. Daten zusammenführen
Wenn Sie Daten aus verschiedenen Quellen zusammenführen, müssen Sie mögliche Unterschiede im Format oder in der Schreibweise berücksichtigen. Ein Fuzzy-Vergleich ermöglicht es Ihnen, ähnliche Strings zu finden und sie zu kombinieren, um einen vollständigen und genauen Datensatz zu erhalten.
3. Suchen nach ähnlichen Werten
Wenn Sie Strings finden müssen, die dem angegebenen Wert ähnlich sind, aber leichte Unterschiede aufweisen können, ist ein Fuzzy-Vergleich ein nützliches Werkzeug. Es ermöglicht Ihnen, Zeichenfolgen zu finden, die einem bestimmten Wert ähnlich sind, auch wenn sie keine vollständige Übereinstimmung darstellen.
4. Daten anpassen
Ein Fuzzy-Vergleich kann verwendet werden, um Fehler in den Daten zu überprüfen und zu korrigieren. Es ermöglicht Ihnen, Tippfehler oder Wertkonflikte schnell und effizient zu finden und zu korrigieren.
Im Allgemeinen können Sie durch die Verwendung eines Fuzzy-Vergleichs in Excel die Genauigkeit und Effizienz der Datenanalyse erhöhen und die Datenqualität in einer Tabelle verbessern.
Wie vergleicht man Strings mit einem Fuzzy-Vergleich in Excel
In Excel können Sie Zeichenfolgen mithilfe eines Fuzzy-Vergleichs vergleichen, um nach ähnlichen oder gleichen Werten zu suchen. Dies ist besonders nützlich, wenn Sie doppelte Daten finden und zusammenführen oder Inkonsistenzen in einem großen Datensatz finden müssen.
Verwenden Sie die Funktion, um einen Fuzzy-Zeilenvergleich in Excel durchzuführen ÜBEREINSTIMMUNG mit einem Suchparameter, der einen Fuzzy-Vergleich berücksichtigt. Hier ist eine Beispielformel:
=ÜBEREINSTIMMUNG(1; KORRIGIEREN(LEVSI(A1; KOLVSIyn; 15); "e"; "e")=KORRIGIEREN(LEVSI(B1; KOLVSIyn; 15); "e"; "e"); 0)
In diesem Beispiel ist die Funktion LEVSI wird verwendet, um einen unscharfen Vergleich von zwei Zeilen (in den Zellen A1 und B1) zu erhalten. Funktion korrigieren wird verwendet, um das Zeichen "e" durch "e" zu ersetzen, um mögliche Unterschiede in der Schreibweise zu berücksichtigen.
Wenn die Zeilen übereinstimmen, gibt diese Formel den Wert 1 zurück, andernfalls wird der Fehlerwert #N/A zurückgegeben. Sie können diese Formel in einem Datenfilter oder in bedingten Formaten verwenden, um übereinstimmende Werte hervorzuheben.
Es gibt auch andere Methoden zum Fuzzy-Vergleichen von Zeichenfolgen in Excel, einschließlich der Verwendung einer Formel ENTFERNUNG VON LIVENSTEIN, die den Unterschied zwischen zwei Zeilen in Form der Anzahl der erforderlichen Operationen misst, um eine Zeile in eine andere umzuwandeln.
Beachten Sie, dass ein Fuzzy-String-Vergleich möglicherweise nicht immer genaue Ergebnisse liefert, daher wird empfohlen, die Ergebnisse immer zu überprüfen und zu verfeinern.