Frage an die Excel Profis!

Cyberflip_2k

New member
Registriert
2 Nov. 2009
Beiträge
1.077
Hallo zusammen. Ich habe da ein Problem, welches ich gerne mit Excel lösen würde - aber ich weiß nicht wie!

Ich habe eine Excel Dateil mit 2 Spalten (A und B) und knapp 60000 Zeilen. In Spalte A sind Benutzernamen aufgeführt - allerdings in der Regel mehrfach. In Spalte B sind den Namen Benutzertypen zugeordnet. Wenn In Spalte A 3x "Hans Müller" steht, steht in Spalte B meistens auch 3x "Techniker". Dann ist "Hans Müller" in Ordnung. Das Problem ist, dass aber bei einigen Usern aber in Spalte B zweimal der "Techniker" und einmal "Putzfrau" steht. Und genau diese Wiedersprüche muss ich finden.

Ich will also wissen welche Zeilen in Spalte B nicht gleich sind, obwohl sie in Spalte A gleich sind. Diese wiedersprüchlichen Zeilen will ich irgendwie kenntlich machen oder herausfiltern.

Bei ein paarhundert wäre es kein großes Problem die manuell zu prüfen- aber es geht mir um genau 57948 Zeilen mit rund 20000 unterschiedlichen Werten in Spalte A und 25 unterschiedlichen Werten in Spalte B!

Hat jemand eine Idee wie ich die Such- und Vergleichsarbeit durch Excel erledigen lassen kann??
 
...Das Problem ist, dass aber bei einigen Usern aber in Spalte B zweimal der "Techniker" und einmal "Putzfrau" steht. Und genau diese Wiedersprüche muss ich finden.

Ich will also wissen welche Zeilen in Spalte B nicht gleich sind, obwohl sie in Spalte A gleich sind. Diese wiedersprüchlichen Zeilen will ich irgendwie kenntlich machen oder herausfiltern.

Bei ein paarhundert wäre es kein großes Problem die manuell zu prüfen- aber es geht mir um genau 57948 Zeilen mit rund 20000 unterschiedlichen Werten in Spalte A und 25 unterschiedlichen Werten in Spalte B!

Hat jemand eine Idee wie ich die Such- und Vergleichsarbeit durch Excel erledigen lassen kann??

Hallo,
wie sollen die Werte markiert werden?
Welcher Eintrag in Spalte B soll denn markiert werden ("Techniker" oder "Putzfrau")?

Ansonsten ließe sich das über manuelles Sortieren im 1. Schritt und danach über filtern manuell bereinigen.
Für VBA sind die obigen Fragen hilfreich, bevor man das umsetzt.

dms

Nachtrag: in Excel gibt es auch die Funktion Duplikate entfernen, welche alles entfernt,
was mehr als einmal vorhanden ist; aber das könnte an deiner Beschreibung evtl. vorbeigehen
 
Zuletzt bearbeitet:
Wenn die Dateien vorab definiert sind, dass Müller = Techniker ist, würde ich eine Wahreitsfunktion machen und die unwahren Werte farblich marieren, bzw. löschen.
 
Würde dir das hier helfen als Beispiel:
Excel.JPG

Die Formel in C2 einfach anpassen (ich habe nur bis Zeile 100 drin) und dann runterziehen: =WENN(VERGLEICH(A2;$A$2:$A$100;0)=VERGLEICH(B2;$B$2:$B$100;0);"ok";"Prüfen")

Edit: Wenn du vorher nach Spalte A sortierst, stehen die Namen untereinander, dann wird es übersichtlicher. Für das Ergebnis in Spalte C spielt das aber keine Rolle.
 
Zuletzt bearbeitet:
Oder: falls besser verständlich:
Code:
=UND(IDENTISCH(B1;C1:F1))
Dann mit Strg+Shift+Enter bestätigen (blos Enter wirft einen "!Wert" Fehler da das Ganze als Matrixformel ausgewertet werden muss)
Das geschriebene Beispiel Vergleicht alle Werte von B1 bis F1 miteinander ;)
das übliche "Runterziehen"(Autovervollständigung) passt die Formel dann entsprechend an (also B2 bis F2, B3 bis F3 ...)

upps, hab jetzt erst die Form der Tabelle verstanden :facepalm:
Die Eingabe als Matrixformel wird aber auch bei gerli09s Formel nötig sein.
 
Zuletzt bearbeitet:
Vorschlag: Spalte A alphabetisch sortieren, dann Werte in Spalte B für gleichen Wert in Spalte A miteinander vergleichen lassen, wo es mehrere unterschiedliche Inhalte in Spalte B (bei gleichem Inhalt Spalte A) gibt, bedingte Formatierung zur Hervorhebung. Oder Werte in Spalte z.B. C entsprechend setzen. ATh.
 
Spalte C = Spalte A verkettet mit Spalte B
Dann Dublikate der Spalte C löschen.
Dann Duplikate der Spalte A suchen.
 
Wow! Ich verstehe zwar grade auf die Schnelle (fast) nur Bahnhof, werde mich aber morgen an der Arbeit mal in Ruhe hinsetzen und mir Eure Lösungsansätze genauer anschauen und ausprobieren. Aber so siegessicher wie die Antworten sich hier so lesen, scheint es ja kein allzugroßes Problem zu sein. Werde natürlich berichten ob bzw. wie ich zum Ziel gekommen bin.
 
Moin zusammen. Habe jetzt eine Stunde lang Excel geübt. Die Lösung von gerli09 war ziemlich genau das, woran ich anfangs gedacht hatte und bei richtiger Anwendung hätte dies sicherlich auch zum Ziel geführt. Aber irgendwie wollte es mit dem runterziehen nicht so recht klappen und mit "Matrixformel" kann ich mal so garnichts anfangen. Glaube das ist schon der Fortgeschrittenen-Kurs...:eek:

Also habe ich es mit dem Ansatz von thomas_e probiert.

Wie vorgeschlagen habe ich in Spalte C die Werte aus A und B verkettet ("=VERKETTEN(A1;B1)" und dann runtergezogen) und dann Duplikate löschen auf Spalte C ausgeführt. Anschließend mittels Bedingter Formatierung die verbliebenen Duplikate in Spalte A farblich markiert. Das hat geklappt.

Eigentlich logisch :rolleyes:

Ob noch weitere Lösungsansätze zum Ziel geführt hätten, habe ich jetzt nicht mehr ausprobiert. Danke an alle für die rege Beteiligung!
 
Wie vorgeschlagen habe ich in Spalte C die Werte aus A und B verkettet ("=VERKETTEN(A1;B1)" und dann runtergezogen) und dann Duplikate löschen auf Spalte C ausgeführt. Anschließend mittels Bedingter Formatierung die verbliebenen Duplikate in Spalte A farblich markiert. Das hat geklappt.

Da das Ganze pädagogisch wertvoll ist, und wir hier im ThinkPad-Forum ja die nächste Generation von Informatikern/Admins mit heranziehen, wäre eine kleine wikimäßige Erklärung mit Screenshots zum direkten Nachmachen wirklich toll! :thumbup:

Hierzu legst Du einfach eine Excel-Beispieldatei mit fünf Einträgen


  1. "Hans Müller", "Techniker"
  2. "Hans Müller", "Reinigungskraft"
  3. "Hans Müller", "Techniker"
  4. "Klaus Meier", "Reinigungskraft"
  5. "Klaus Meier", "Reinigungskraft"

an und demonstrierst mit Screenshots (der enthält auch Formelfeld), wie Du den dritten Eintrag markiert und entfernt hast. Das Ganze dauert 20 Minuten, und damit würdest Du eine Menge hier mitlesender Leute glücklich machen. :)
 
Wie du schon sagst ... wir sind ein Thinkpad-Forum .. kein Excel-Forum
 
Das war doch nur nett gemeint! Und die Rubrik heißt "Software allgemein"...:)
 
Das war doch nur nett gemeint! Und die Rubrik heißt "Software allgemein"...:)

Ja, im Prinzip finde ich das mit dem Wiki auch ne gute Idee. Aber meine (bzw. thomas_es) in Beitrag #9 beschriebene Lösung ist denkbar einfach und bedarf m.E. neben der Textform keiner weiteren Erklärung oder gar Screenshots. Wenn es mit gerli09s Ansatz geklappt hätte, wäre es sicher was anderes gewesen :cool:
 
Zuletzt bearbeitet:
Dann nochmal zur Erklärung: die Formel in C2 =WENN(VERGLEICH(A2;$A$2:$A$100;0)=VERGLEICH(B2;$B$ 2:$B$100;0);"ok";"Prüfen") müsste nur an die effektive Zahl der Einträge angepaßt werden also z.b. für 60000 Zeilen hieße die dann:
=WENN(VERGLEICH(A2;$A$2:$A$60000;0)=VERGLEICH(B2;$B$ 2:$B$60000;0);"ok";"Prüfen"). Die Formel wird dann einfach durch Ziehen bis zur Zelle C60000 erweitert. Man könnte dann natürlich noch mit einer bedingten Formatierung rumspielen und da wo "Prüfen" rauskommt, das rot hinterlegen oder so.
 
Falls man sich das ständige Umformulieren sparen will bietet sich gleich eine Festlegung des Maximums auf 2147483647 an.
Wieso genau diese Zahl: Das ist die maximale als 32-Bit-Integer darstellbare Zahl und somit auch für eine eventuelle spätere Automatisierung unproblematisch ;)
 
Lege doch mal eine Pivot-Tabelle drüber, dann weisst Du welche und wieviele Datensätze von so einem "Fehler" betroffen sind. Und je nach Anzahl kannst Du die dann durch filtern schnell manuell überarbeiten oder einen geeigneten Automatismus entwickeln. Aber bei der Pivot erkennst Du sehr schnell, welcher Nutzername davon betroffen ist...
 
  • ok1.de
  • ok2.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben