Passendes Excel Diagramm für Messewerte

cubei

Member
Themenstarter
Registriert
24 Juli 2013
Beiträge
311
Hallo Leute,
ich schaffe es gerade nicht was passendes zu finden, um meine Messwerte zu visualisieren.
Ich habe in Excel eine Spalte mit 1000 Werten. Durchschnitt ist ca. 50.000. Die Werte variieren natürlich und bewegen sich in etwa zwischen 40.000 und 60.000. Das möchte ich jetzt in einem Diagramm anzeigen.
Ich habe dann ein Punkt XY Diagramm genommen und für die X-Achse einfach einen konstanten Wert genommen, sodass alle Messwerte in der vertikalen eingetragen werden. Das sieht dann so aus:
diagramm.PNG
Dadurch kann man auch recht gut sehen, in welchem Bereich die Werte liegen. Ich möchte aber darstellen, dass diese Extremwerte nur recht selten vorkommen und die meisten Punkte bei 50.000 liegen. Deswegen dachte ich, dass die Punkte bei einer Häufig größer sein sollten. Aber dazu finde ich kein passendes Diagramm.

Das einzige, was ein bisschen danach klingt, ist das Blasendiagramm, bei dem man noch Daten für die Größe der Blasen mitgibt. Aber die einzige Möglichkeit, die mir einfällt, um das umzusetzen, wäre:
Ich runde alle Werte auf ganze Tausender. Dann gibt es nicht mehr so viele verschiedene Werte. Die ca. 30 möglichen Werte zähle ich dann. Und dann kann ich an Hand der Anzahl, die Blasengröße für diesen Wert festlegen.
Aber eigentlich ist mir das zu blöd.

Fällt jemanden noch was ein, womit ich die gewünschte Darstellung hin bekomme?
 
Also ich würde das mit Boxplots darstellen. Da werden Ausreißer kenntlich gemacht du hast das untere und obere Quartil sowie den median. Dazu dann noch den Mittelwert anzeigen lassen, und du hast die meisten statistischen Eckdaten beieinander.
 
Mit deinem Problem kann ich dir leider nicht direkt weiterhelfen.
Als Anregung aber mal die Frage: Bist du dir sicher, dass deine Angedachte Art der Darstellung überhaupt so sinnvoll ist?

Wenn ich deine Daten richtig interpretiere, hast du die prinzipiell gleiche Messung in drei unterschiedlichen Konfigurationen sehr oft wiederholt. Ich weiß nicht wofür du die Grafik brauchst und inwieweit du dich mit Statistik und der Wahrscheinlichkeitsrechnung auskennst, aber wäre nicht für jede Konfiguration der Mittelwert inklusive Standardabweichung völlig ausreichend?
 
Diese Darstellung finde ich auch nicht passend.
Die 1000 Punkte scheinen sehr gleichmäßig verteilt bis auf ein paar kleine Ausreisser oben und unten. Durchschnitt von 50k ist demnach nicht zu erkennen.
 
Also ich würde das mit Boxplots darstellen.
Danke, das hört sich gut an :thumbsup:. Nur zu blöd, dass Excel so was nicht kann. Bis auf den oberen Abschluss des Schnurrhaars habe ich aber was hinbekommen, was das ganz gut darstellt, imo.

Ich weiß nicht wofür du die Grafik brauchst und inwieweit du dich mit Statistik und der Wahrscheinlichkeitsrechnung auskennst, aber wäre nicht für jede Konfiguration der Mittelwert inklusive Standardabweichung völlig ausreichend?
Ein Bild sagt mehr als tausend Worte ;) Diagramme machen sich doch immer besser, als einfache Zahlen.

Die 1000 Punkte scheinen sehr gleichmäßig verteilt bis auf ein paar kleine Ausreisser oben und unten. Durchschnitt von 50k ist demnach nicht zu erkennen.
Deswegen suche ich ja was besseres.
Hier kann man es jetzt besser erkennen:
display2display.png
Wenn ich keine Fehler gemacht habe, dann beinhaltet die blaue Box 50 % der Werte, die Linie in der Mitte ist der Durchschnitt (nicht Median) und die Schnurrhaare oben und unten sollten jeweils 25 % der Werte halten.

Lies dir mal den zentralen Grenzwertsatz durch. Könnte dir weiterhelfen.
Sorry, hört sich zu kompliziert an :rolleyes: und ich bin jetzt schon zufrieden.

Danke nochmal an alle. Hat mir geholfen.
 
Eventuell könntest du die Werte hochladen (Textdatei, Excel?) sofern sie nicht zu "wichtig" sind, dann könnt ich auch was probieren.
 
Eventuell könntest du die Werte hochladen (Textdatei, Excel?) sofern sie nicht zu "wichtig" sind, dann könnt ich auch was probieren.
Ich bin zufrieden, musst dich nicht mehr bemühen. Ich will auch nicht mehr Zeit als nötig in solche Kosmetik stecken.
Aber wenn du Lust hast:
Hier sind einfach ein paar Werte unter einander: http://pastebin.com/M9dHQ7ZX
Hier die Excel 2013 Datei mit der ich das aktuelle Diagramm gezeichnet habe: https://dl.dropboxusercontent.com/u/5227389/image_processing.xlsx
 
Ein Bild sagt mehr als tausend Worte Diagramme machen sich doch immer besser, als einfache Zahlen.
Dem widerspreche ich jetzt mal... insbesondere da du in deinem Diagramm ja jetzt auch nichts anderes als einen Mittelwert mit gleich zwei ziemlich willkürlich gewählten Konfidenzintervallen eingezeichnet hast.

So macht man das eigentlich nicht, aber wer weiß für was für ein verqueres Publikum du da Daten visualisieren willst/musst. ;)
 
Geh das Ganze vielleicht mal von einer anderen Seite an: Kläre zunächst mal, welche Aussage die Visualisierung hervorbringen soll. 2 Beispiele:
- Willst Du zeigen, dass Du fleißig gemessen hast, ist Dein x/y-plot doch ideal
- Geht es um den Wertebereich und die aufgetretenen Abweichungen, sind Mittelwert und Standardabweichung gut geeignet, da brauchts keine Visualisierung für denjenigen, der mit der Messreihe was anfangen kann

Du siehst ja nach gewollter Aussage kann es von bis gehen.

Grüße Thomas
 
@schoerg
Sieht gut aus, aber mit Excel kriege ich das ja ähnlich hin und ich habe keine Lust mich erst einzuarbeiten.

Geh das Ganze vielleicht mal von einer anderen Seite an: Kläre zunächst mal, welche Aussage die Visualisierung hervorbringen soll.
Weil Ede_123 so gemein war, kann ich ja nicht mehr sagen, was das genau für eine Arbeit ist :zornig:
Die Werte sind Zeiten, und ich will aussagen, dass der Prozess etwa 53 ms braucht, es können auch mal 65 ms sein, aber das ist eine Ausnahme und geschieht selten.
Mittelwert: 53.272 µs
Standardabweichung: 5.346 µs (Excel hat sogar Befehle für die Varianz und Standardabweichung
:thumbup:)
Ich finde, dass das BoxPlot Diagramm das besser darstellt, aber es schadet sich nicht, auch noch Begriffe wie Standardabweichung mit in den Text zu schreiben
:rolleyes:, Diagramm findet dann im Anhang platz.
boxplot.png
 
Sorry, hört sich zu kompliziert an :rolleyes: und ich bin jetzt schon zufrieden.
Kurzum und ohne mathematische Herleitung besagen die Lindeberg- und Ljapunow-Bedingungen, dass der zentrale Grenzwertsatz auch Geltung hat, wenn die Anzahl n der unabhängigen Zufallsvariablen (Voraussetzung dieser: der Erwartungswert ist endlich und die Varianz zwischen Null und unendlich liegt) beliebig verteilt sind, konvergiert die Summe für n gegen unendlich zu einer Normalverteilung respektive eben dann zu einer Standardnormalverteilung.

Du würdest also gut liegen, wenn du von einer Normalverteilung/Standardnormalverteilung ausgehst, auch wenn die Voraussetzungen dafür nicht ganz gegeben sind.


LG Uwe
 
Ich weiß nicht ob dir das weiterhilft:
Aber wenn du die Punkte etwas kleiner machst und gleichzeitig die 10'000er Achse länger machst (egal ob jetzt senkrecht, oder gedreht also liegend) sollten sich doch die Ausreißer deutlich vereinzeln.
Oder du arbeitest mit 2 Diagrammen: eins für die Verteilung(Punkte) und eins für die Häufung(Blasen)
 
Lies dir mal den zentralen Grenzwertsatz durch. Könnte dir weiterhelfen.
Der hilft leider bei der Erstellung der gewünschten Grafik nicht weiter. Der würde helfen wenn es um statistische Auswertung und Nachweis/Widerlegung von Hypothesen geht.
Danke, das hört sich gut an :thumbsup:. Nur zu blöd, dass Excel so was nicht kann. Bis auf den oberen Abschluss des Schnurrhaars habe ich aber was hinbekommen, was das ganz gut darstellt, imo.


Ein Bild sagt mehr als tausend Worte ;) Diagramme machen sich doch immer besser, als einfache Zahlen.


Deswegen suche ich ja was besseres.
Hier kann man es jetzt besser erkennen:
Anhang anzeigen 94550
Wenn ich keine Fehler gemacht habe, dann beinhaltet die blaue Box 50 % der Werte, die Linie in der Mitte ist der Durchschnitt (nicht Median) und die Schnurrhaare oben und unten sollten jeweils 25 % der Werte halten.


Sorry, hört sich zu kompliziert an :rolleyes: und ich bin jetzt schon zufrieden.

Danke nochmal an alle. Hat mir geholfen.
Sieht doch gut aus. Mit ein wenig Einarbeitung kann man das super mit R darstellen und bei Bedarf auch auswerten.
Der mittlere Strich stellt normalerweise (so auch in R) den median dar. Meist wird der Mittelwert als X dargestellt. Kann aber sein, dass das bei Excel anders ist.
Und wenn die Daten normalverteilt (und nicht schief) und n ausreichend groß ist unterscheiden sie sich nur gering. Siehe auch Link von @Helios.

Diese Darstellung finde ich auch nicht passend.
Die 1000 Punkte scheinen sehr gleichmäßig verteilt bis auf ein paar kleine Ausreisser oben und unten. Durchschnitt von 50k ist demnach nicht zu erkennen.
Der Boxplot stellt es angemessen dar, solang es nicht nur um direkte Darstellung der Messpunkte geht.
 
Ich weiß nicht ob dir das weiterhilft:
Aber wenn du die Punkte etwas kleiner machst und gleichzeitig die 10'000er Achse länger machst (egal ob jetzt senkrecht, oder gedreht also liegend) sollten sich doch die Ausreißer deutlich vereinzeln.
Wenn man es ordentlich lang zieht, lassen sich auf jeden Fall einzelne Ausreißer sehen, aber um welchen Bereich es sich häuft ist immer noch nicht ganz deutlich. Bei 1.000 Werten, die abgebildet werden, sieht man in der Mitte immer noch nur einen Strich, der auf eine Gleichverteilung schließen lässt.

Sieht doch gut aus.
Finde ich auch :rolleyes:

Der mittlere Strich stellt normalerweise (so auch in R) den median dar. Meist wird der Mittelwert als X dargestellt. Kann aber sein, dass das bei Excel anders ist.
Deswegen hatte ich es extra erwähnt. Ich finde, dass der Mittelwert sinnvoller als der Median ist.
Excel unterstützt das von alleine gar nicht. Es gibt aber Anleitungen, wie man es trotzdem hin bekommt. Falls es jemanden interessiert:
Man muss die 5 Bereiche berechnen und als Säulendiagramm darstellen. Dann macht man Füllung und Umrandung des 1., 4. und 5. Bereichs leer/aus und macht aus dem 1. und dem 4. eine Linie. :facepalm:
 
Weil Ede_123 so gemein war, kann ich ja nicht mehr sagen, was das genau für eine Arbeit ist

Sorry, aber wo war ich denn jetzt gemein? Falls du dich auf mein "verqueres Publikum" beziehst war das zum einen nicht ganz ernst gemeint und sollte zum anderen darauf anspielen, dass es in unterschiedlichen Fachgebieten nunmal völlig unterschiedliche Vorlieben gibt Daten zu visualisieren, die nicht unbedingt kompatibel zueinander sind. Was von meinem Standpunkt als Physiker aus ein absolutes No-Go wäre, kann für deine Anwendung völlig akzeptabel und vielleicht ja sogar explizit erwünscht sein.

Ich wollte nur klar machen, dass ich es eben nicht so machen würde und dir den in meinen Augen direktesten Weg aufzeigen, der aber für deine Anwendung durchaus unbrauchbar sein kann.


P.S. Wenn es sich bei deinen Werten um Zeiten im Bereich von etwa 53 ms handelt, würde ich die y-Achse auch in Millisekunden auftragen, statt 53.000 us zu schreiben. Die drei Nullen kannst du dir schließlich auch jeweils sparen.
 
Zuletzt bearbeitet:
Sehe hier auch keine Beleidigung seitens Ede_123 gegenüber dir. Liest sich ja aus dem Text selbst heraus. Und die Smiles nicht ignorieren.
 
Sorry, aber wo war ich denn jetzt gemein? Falls du dich auf mein "verqueres Publikum" beziehst war das zum einen nicht ganz ernst gemeint
Kein Grund dich zu rechtfertigen, ich habe das schon als weniger ernst verstanden und die Kritik mit genommen.

P.S. Wenn es sich bei deinen Werten um Zeiten im Bereich von etwa 53 ms handelt, würde ich die y-Achse auch in Millisekunden auftragen, statt 53.000 us zu schreiben. Die drei Nullen kannst du dir schließlich auch jeweils sparen.
Habe ich jetzt auch gemacht, siehe Post #12

Sehe hier auch keine Beleidigung seitens Ede_123 gegenüber dir. Liest sich ja aus dem Text selbst heraus. Und die Smiles nicht ignorieren.
War auch nicht so aufgefasst. Ich habe ja auch einen Smiley benutzt.
 
  • ok1.de
  • ok2.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben