IBM SPSS ist eine Standardsoftware für die Verarbeitung empirischer Daten. Sie ermöglicht die flexible, individuelle, sichere und zuverlässige Eingabe und Bearbeitung der gewonnen Daten. Mit Hilfe der graphischen Benutzeroberfläche des Tools lassen sich mit wenigen Klicks Tabellen, Diagramme und eine Vielzahl statistischer Auswertungen intuitiv realisieren. Mit den verschiedensten Programm-Modulen des Systems werden Forschungsarbeiten technisch umfangreich unterstützt. Der Umgang und die Anwendung dieser Software zeigen eine charakteristische Systematik und eine eigene Programm-Arbeitslogik. Dieser Beitrag skizziert die charakteristische Nutzung des Systems. Der Artikel gibt einen Einblick in diese Arbeitslogik indem die Verarbeitung von Befragungsergebnissen mit SPSS skizziert wird. Die für das Verständnis des Systems erforderlichen statistischen Grundlagen werden in der Abhandlung ebenfalls knapp mitgeliefert.
Inhalt
- Einleitung und Vorhaben
- Statistische Grundbegriffe der Datenerhebung, statistische Grundlagen für das Arbeiten mit IBM SPSS
- Codierung der Datenerhebung, Vorbereitungen für die Datenerfassung mit IBM SPSS
- Arbeiten mit IBM SPSS, Variablenansicht, Datenansicht
- Übertragung der Codierung ins System, Variablenansicht, Labels, Messniveau
- Übertragung der Daten der Fragebögen ins System, Kontrolle der erfassten Daten, Datenansicht
- Einblick in das Erstellen von Analysen, Tabellen, Grafiken mit IBM SPSS
- Resümee und Hinweise
AbbildungsverzeichnisAbbildung 1: Fragebogen der Telefonumfrage
Abbildung 2: Codierungsschema des Fragebogens
Literaturverzeichnis 1. Einleitung und Vorhaben
IBM SPSS ist eine Standardsoftware für die Verarbeitung empirischer Daten[1]. Sie ermöglicht die flexible, individuelle, sichere und zuverlässige Eingabe und Bearbeitung der gewonnen Daten, die statistische Analyse, das Datenmanagement und die Datendokumentaton. Auf komfortable Weise können mit dieser Software statistische Analysen realisiert werden ohne gleich ein Statistikprofi sein zu müssen. Der intuitive Zugang zur statistischen Datenanalyse mit SPSS kann eine Abneigung gegenüber Statistik in Begeisterung überführen und dazu beitragen, dass man sich gerne mit Datensammlungen eingehender beschäftigen möchte. Eine Verhaltensweise, die in unserer modernen Informationsgesellschaft und dem Drang nach datengestützter Entscheidungsfindung von großer Bedeutung ist.
Mit Hilfe der graphischen Benutzeroberfläche von IBM SPSS lassen sich Tabellen, Diagramme und eine Vielzahl von statistischen Auswertungen mit wenigen Klicks realisieren. Die Vielzahl der Programm-Module von IBM SPSS unterstützen die Primär- und Sekundärforschungen technisch äußerst umfangreich.
Der Umgang und die Anwendung dieser Software zeigt eine charakteristische Systematik und eigene Programm-Arbeitslogik. Diese charakteristische Nutzung des Systems soll in diesem Artikel skizziert werden. Erforderliche statistische Grundlagen für die Datenverarbeitung und das Arbeiten mit SPSS werden hier knapp mitgeliefert (Kapitel 2.). Es wird ein erster praxisorientierter Einstieg in die Nutzung der Software geschaffen, indem die Verarbeitung von Befragungsergebnisse mit SPSS dargestellt wird[2]. Die Kapitel 3. bis 6. geben einen Einblick in die Bedienung von IBM SPSS Statistics und orientieren sich dabei an den Arbeitsschritten einer Datenbearbeitung, wie sie in der Praxis und der Verarbeitung von Umfragen erfolgt. Die vollständige Abbildung des Programms und eine Aneinanderreihung aller Programm-Funktionalitäten werden in diesem Artikel ausgeklammert.[3]
2. Statistische Grundbegriffe der Datenerhebung, statistische Grundlagen für das Arbeiten mit IBM SPSS
Man stelle sich zum Beispiel einen Bio-Landwirt vor, der eine neue Bio-Knolle speziell für Diabetiker vermarkten möchte. Diese Knolle kann in der Küche als Alternative für eine Kartoffel verwendet werden und bietet dem Landwirt zahlreiche Vorteile. Der Landwirt befragt nun vor der Markteinführung seiner Bio-Knolle insgesamt 500 der 1.500 Diabetiker seines Verkaufsgebietes.
Nach seiner Umfrage versucht der Bio-Landwirt die erhaltenen Angaben der 500 Probanden sinnvoll und übersichtlich zusammenzufassen. Er möchte erfahren, welche Informationen in den erhobenen Daten stecken. Dieses Vorgehen wird in der Statistik „Deskriptive Statistik" genannt.
Innerhalb der Deskriptiven Statistik werden die Rohdaten - wie diese 500 Befragungsergebnisse des Bio-Landwirts - numerisch oder grafisch so bearbeitet bzw. zusammengefasst, dass wesentliche Aspekte erkennbar werden.
Der Bio-Landwirt gewinnt durch die Befragung der 500 Personen wichtige Informationen und beobachtet z. B. Einstellungen und die Zahlungsbereitschaft (= Merkmale oder Variable) der Testpersonen. Diese Testpersonen werden daher als Beobachtungseinheiten, Fälle oder Merkmalsträger bezeichnet.[3]
Die 500 Beobachtungseinheiten des Bio-Landwirts stammen dabei aus eine definierten Menge aller möglichen Beobachtungseinheiten (1.500 Diabetiker des Verkaufsgebietes des Landwirts). Diese Menge aller möglichen Beobachtungseinheiten nennt man auch Grundgesamtheit. Statistische Erhebungen wie die Befragung des Bio-Landwirts dienen also dazu, Informationen über eine genau definierte Menge von Beobachtungseinheiten zu gewinnen.
Der Bio-Landwirt wählt für seine Befragung - damit sein Vorhaben noch praktikabel bleibt - aus der Grundgesamtheit nach bestimmten Kriterien eine Anzahl von Personen aus und bildet auf diese Weise die Stichprobe seiner Befragung. Die Stichprobe (500 Testpersonen = Stichprobenumfang) ist eine Teilmenge der Grundgesamtheit und soll ein möglichst getreues Abbild der Grundgesamtheit darstellen.[4]
Die erhobenen Variablen bzw. Merkmale können unterschiedliche Werte annehmen (= Merkmalsausprägungen). Die Zuordnung von bestimmten Werten zu Merkmalen ist eine Messung. Beispielsweise befragt der Bio-Landwirt Testperson A zur Zahlungsbereitschaft. Testperson A gibt als Antwort 2 €. Bei diesem Vorgang wird dem Merkmal Zahlungsbereitschaft der Wert 2 € zugeordnet und damit die Zahlungsbereitschaft der Testperson A gemessen.
Die Messwerte der Zahlungsbereitschaft hat der Bio-Landwirt als exakte €-Beträge erhalten. Der Bio-Landwirt hätte aber auch Angaben wie „viel", „wenig" oder „nichts" provozieren können. Selbst Angaben wie „ein runder Betrag" oder „ein ungerader Betrag" wären denkbar gewesen. Je nach Art der verwendeten Messwerte (Datentypen) sind unterschiedliche statistische Analysen mit den erhobenen Daten denkbar.
Die möglichen Datentypen lassen sind folgendermaßen strukturieren:
- Datentypen sind nominal: Werte lassen sich nicht sinnvoll ordnen (z. B. „ein runder Betrag", „ein ungerader Betrag")
- Datentypen sind ordinal: Werte lassen sich sinnvoll ordnen (z. B. „viel", „wenig", „nichts")
- Datentypen sind metrisch und lassen sich sinnvoll ordnen (z. B. Zahlen wie €-Beträge oder Altersangaben).
Die eingesetzte Wertereihe innerhalb der Messung wird auch als Skala bezeichnet. So wird bei a.) eine Nominal-Skala, bei b.) eine Ordinal-Skala und bei c.) eine metrische Skala verwendet. Je nach verwendeter Skala werden unterschiedlich viele Informationen erzeugt. Die meisten Informationen ergeben sich bei Datenerhebungen durch die Verwendung der metrischen Skalen. Mit metrischen Daten lassen sich im Vergleich zu nominalen und ordinalen Daten statistische und mathematische Operationen durchführen. Metrische Daten lassen sich addieren, es lassen sich Verhältnisse und Abstände berechnen. Metrische Daten können außerdem in ordinale oder nominale Daten transformiert werden.
3. Codierung der Datenerhebung, Vorbereitungen für die Datenerfassung mit IBM SPSS
Der Bio-Landwirt verwendet für seine Datenerhebung bei den 500 Diabetikern zur Ergründung der Erfolgschancen seiner Bio-Knolle einen Fragebogen (Telefoninterview), der z. B. folgende Inhalte[5] aufweisen kann (vgl. Abbildung 1):
Fragebogen-ID. … F.: 1. Geschlecht des Befragten: □ weiblich, □ männlich, □ keine Angaben 2. Bitte verraten Sie mir Ihr Alter? ____ Jahre 3. … 4. Kennen Sie den Bio-Hof XY? □ ja, □ nein 5. … 6. Wir haben uns nun über diese Bio-Knolle unterhalten. Wenn Sie diese Knolle kaufen könnten, was wären Sie bereit für diese Knolle in € auszugeben? ______ € 7. … |
Abbildung 1: Fragebogen der TelefonumfrageDie einzelnen Fragen des Fragebogens dienen der Messung der Merkmalsausprägungen der Merkmale bei jedem Merkmalsträger.
Wenn der Bio-Landwirt seine Befragung abgeschlossen hat, wird er 500 ausgefüllte Fragebögen vorliegen haben, deren Daten er mit IBM SPSS erfassen möchte. Vor der Dateneingabe ins System sollte der Landwirt ein Codierungsschema entwerfen. Dazu nimmt der Bio-Landwirt einen leeren Fragebogen zur Hand und vergibt für jedes Merkmal des Fragebogens und für jede Merkmalsausprägung einen Code. Die einzelnen Codes und deren Eigenschaften werden dann in SPSS übertragen. Dem System wird damit eine Ordnung vorgegeben mit dem es arbeitet.
Dieses Codierungsschema des Fragebogens könnte folgendes Aussehen haben[6] (vgl. Abbildung 2):
Fragebogen-ID. … (>> Code: id)
F.: 1. Geschlecht des Befragten: (>> Code: sex) □ weiblich, (>> Code: 1) □ männlich, (>> Code: 2)
□ keine Angaben (>> Code: 0)
2. Bitte verraten Sie mir Ihr Alter? ____ Jahre (>> Code: alter)
3. … 4. Kennen Sie den Bio-Hof XY? (>> Code: hof) □ ja, (Code: 1) □ nein (>> Code: 2)
5. … 6. Wir haben uns nun über diese Bio-Knolle unterhalten. Wenn Sie diese Knolle kaufen könnten, was wären Sie bereit für diese Knolle in € auszugeben? ______ € (Code: zahlg)
7. … |
Abbildung 2: Codierungsschema des FragebogensDie Codes können in IBM SPSS maximal 64 Zeichen umfassen. Für die Übersichtlichkeit im System mit seinen Tabellen empfiehlt es sich jedoch möglichst kurze, „sprechende" Codes zu vergeben. Die Zeichen in den Codes können Buchstaben (Groß- und Kleinschreibung), Zahlen oder Sonderzeichen sein. Die Zeichen „_" oder „." als letztes Zeichen sowie ein Leerzeichen und AND, ALL, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO, WITH sollen nicht eingesetzt werden.
Für die möglichen Merkmalsausprägungen auf dem Fragebogen vergibt man aus Gründen der Praktikabilität Zahlen als Codes (idealer Weise eine aufsteigende Zahlenfolge). Bei der Dateneingabe ins System wird je nach Merkmalsausprägung auf dem Fragebogen der zugehörige Code eingegeben.
Für metrische Merkmalsausprägungen (hier z. B. Alter oder Zahlungsbereitschaft) müssen keine Codes entworfen werden. Bei der Dateneingabe ins System wird die konkrete Zahl aus dem Fragebogens eingegeben.
Durch diese Vorarbeiten wird die Datenerfassung und Datenanalyse im System erleichtert und beschleunigen.
4. Arbeiten mit IBM SPSS, Variablenansicht, Datenansicht
4.1. Übertragung der Codierung ins System, Variablenansicht, Labels, Messniveau
Der Landwirt hat nun sein Codierungsschema festgelegt und wird dies und die Daten auf den Fragebögen in IBM SPSS eingeben. Dazu ruft er das Programm IBM SPSS Statistics auf. Wenn das Programm gestartet ist, erscheint ein Programmfenster mit der Anwendungsmöglichkeit Dateneingabe. Diese Anwendungsmöglichkeit wird aktiviert und das Daten-Editor-Blatt öffnet sich. Dieses Arbeitsblatt ist mit einer Menüleiste und einer Symbolleiste ausgestattet und gleicht dem Arbeitsblatt eines gewöhnlichen Tabellenkalkulationsprogramms.
Auf diesem Arbeitsblatt befinden sich am unteren Rand das Bedienfeld Datenansicht und das Bedienfeld Variablenansicht. Zunächst wird die Variablenansicht mit der Computer-Maus angeklickt und im erscheinenden Tabellenblatt das Codierungsschema des Fragebogens eingetragen.
Folgende Arbeitsschritte werden dort durchgeführt
a.) Spalte mit Überschrift „Name" bearbeiten:
In das erste Kästchen der ersten Zeile wird der Code für die Fragebogennummerierung (id) eingegeben. In die nächsten Kästchen darunter kommen die jeweiligen Codes der einzelnen Fragen des Fragebogens (vgl. Codierungsschema oben).
Jede Zeile ab Zeile 2 wird für den Code einer Frage des Fragebogens verwendet.
Mit den Pfeiltasten oder der Return-Taste bestätigt man eine Eingabe und gelangt in ein nächstes Kästchen.
Das System füllt automatisch die Felder ab Spalte 2 mit voreingestellten Werten auf, sobald man die Codes in Spalte 1 eingegeben hat und in ein nächstes Kästchen springt.
b.) Felder ab Spalte 2 (insbesondere mit Überschrift „Variablenlabel", „Wertelabel" und „Messniveau"[8]) Zeile für Zeile modifizieren/definieren:
Spalte „Variablenlabel":
In den Feldern in dieser Spalte werden die verwendeten Codes der Spalte 1 jeder Zeile ausführlicher beschrieben und die Bedeutung des Codes festgehalten. Z. B. wird für den Kode „id" Fragebogen-ID oder für den Code „sex" Geschlecht eingetragen.
Spalte „Wertelabels":
Hier können für nominale oder ordinale Werte der Merkmalsausprägungen einzelner Fragen Codes vergeben werden. Z. B. können für den Wert männlich der Code „2" und für den Wert weiblich der Code „1" eingetragen werden („keine Angaben" = 0).
Man klickt dazu in einer Zeile, die eine Frage mit nominalen oder ordinalen Merkmalsausprägungen besitzt, auf das zugehörige Kästchen in der Spalte „Wertelabels".[9]
Auf diese Weise wird eine Dialogbox geöffnet, in der, den Anweisungen des Systems folgend, die Zuordnungsregeln eingegeben werden.
Im Feld „Wert" wird der Zahlencode eingegeben, mit der man eine Merkmalsausprägung definieren möchte, und im Feld „Beschriftung" die verbale Zuordnung zum definierten Zahlencode. Durch betätigen von „Hinzufügen" wird die gemachte Definition in ein Fenster geschoben und als Vorgabe für das System verankert.
Dieser Vorgang wird so lange wiederholt bis alle möglichen Merkmalsausprägungen definiert sind. Abschließend wird durch Aktivierung von „OK" die Systemanweisung aktiviert.
Die Codes bzw. die Zahlen können dann in der Datenansicht je nach Merkmalsausprägung auf dem Fragebogen eingesetzt werden. Die Eingabe der Daten der Fragebögen in der Datenansicht wird dadurch vereinfacht und beschleunigt.
Spalte „Messniveau":
Hier werden die Datentypen der Merkmale definiert (nominal, ordinal, metrisch). Die Festlegung des Messniveaus bestimmt die grafischen und analytischen Möglichkeiten des Systems.
Sind alle Modifizierungen und Definitionen in den Spalten gemacht und das ganze Codierungsschema ins System übertragen worden (vgl. Abbildung 5), können die Eingaben analog der Speichervorgänge von Windows-Anwendungen abgespeichert werden (Dateityp „.sav").
4.2. Übertragung der Daten der Fragebögen ins System, Kontrolle der erfassten Daten, Datenansicht
Die Erfassung der Daten der 500 Fragebögen des Bio-Landwirts erfolgt in der Datenansicht. Jede Zeile in der Datenansicht entspricht einem Fall (Fragebogen). Die einzelnen Zellen lassen sich mit den Pfeiltasten ansteuern. Die Spalten der Datenansicht entsprechen den einzelnen Merkmalen des Fragenbogens. Die einzelnen Zellen einer Spalte nehmen die jeweiligen Merkmalsausprägungen der Fragen auf.
Der Bio-Landwirt wird zur Eingabe der Daten seiner Umfrage daher die erste Zelle ansteuern und dort den entsprechenden Wert des Fragebogens eingeben. Gemäß Codierungsschema nehmen die Zellen in der ersten Spalte der Datenansicht die Fragebogennummern auf (id). Möchte der Bio-Landwirt z. B. als erste Erfassung die Daten des Fragebogens mit der Nummer 001 eingeben, dann trägt er in der ersten Zeile und in die erste Zelle 001 ein. Mit der Pfeiltaste kann der Bio-Landwirt in die nächste Zelle wandern. In der Spalte 2 gibt er die Zahlen der Geschlechterdefinitionen entsprechend der Merkmalsausprägungen der Fragebögen ein. Die Zahl 2 für männlich und die Zahl 1 für weiblich. In der Spalte 3 trägt der Bio-Landwirt die Altersangaben ein und so weiter bis er alle Daten der Umfrage erfasst hat. Die Abspeicherung der Dateneingaben erfolgt analog der Abspeicherungen bei der Variablenansicht.
Werden in Zellen keine Eingaben vorgenommen, fügt das System in der entsprechenden Zelle automatisch einen Punkt ein und behandelt diesen Punkt als fehlenden Wert.[10]
Möchte man Zeilen innerhalb der bereits erfassten Zeilen einfügen oder löschen kann mit dem Cursor die gewünschte Stelle angesteuert werden und z. B. über das entsprechende Symbol der Symbolleiste oder mit betätigen der rechten Maustaste eine Zeile (Fälle einfügen) eingefügt oder gelöscht werden.
Vor der Durchführung von Datenanalysen sollten die Dateneingaben auf ihre Korrektheit überprüft werden. Dafür können neben der (stichprobenartigen) Sichtkontrolle der Eingaben auch verschiedene Statistiken durch das System erzeugt werden. Beispielsweise können Häufigkeiten und Kreuztabellen erstellt werden, anhand derer man Eingabefehler und Unregelmäßigkeiten identifiziert (Werte, die nicht vorkommen können).[11] Diese Statistiken lassen sich mit der Menüauswahl „Analysieren" und dann „Deskriptive Statistik" erzeugen.
5. Einblick in das Erstellen von Analysen, Tabellen, Grafiken mit IBM SPSS
Hat der Bio-Landwirt alle erhobenen Daten erfasst kann er mit der Datenanalyse beginnen. Eine seiner ersten Analysen kann das Darstellen von Häufigkeiten einzelner Merkmalsausprägungen sein. Dazu öffnet er in SPSS in der Menüleiste „Analysieren" und von dort aus „Deskriptive Statistik" und anschließend „Häufigkeiten". In der erscheinenden Dialogbox markiert er die Variablen, für die Häufigkeiten ermittelt werden sollen, und schiebt diese Variablen in das Fenster „Variable(n):" (mit der markanten Pfeiltaste in der Mitte der Box). Die Analyse wird mit einem Klick auf „OK" aktiviert
In SPSS öffnet sich dann ein Ausgabefenster. Dieses Fenster besteht ebenfalls aus einer Menüleiste und einer Symbolleiste sowie zwei weiteren Fenstern. Das rechte dieser Fenster enthält das Analyse-Ergebnis und das linke Fenster zeigt eine Übersicht über die Inhalte des rechten Fensters in Form einer Gliederungsstruktur zur schnellen Navigation und Orientierung wie man es aus Windows-Anwendungen her kennt.
Die Ergebnisse im rechten Fenster werden vom System errechnet. Als Überschrift der Ergebnisse erscheint die durchgeführte Prozedur (hier Häufigkeiten). Darunter befinden sich die einzelnen errechneten Statistiken.
Zuerst wird eine kleine Tabelle mit den verwendeten Fällen und den fehlenden Werten abgebildet. Danach folgt die Tabelle mit den Häufigkeiten für die ausgewählten Variablen.
Möchte man die Ergebnisse als Grafik darstellen, öffnet man in der Menüleiste „Diagramme" und dann „Diagrammerstellung". Von dort gelangt man in ein Dialogfenster, in dem man mit die gewünschte Grafik anwählen und aktivieren kann. Die Achsenbeschriftung der gewählten Grafik kann durch ziehen einzelner Variablen auf die Achsen der Grafik festgelegt werden. Durch aktivieren von „OK" wird die Grafik erzeugt und aufgerufen.
Einzelne Elemente der erzeugten Tabellen und Grafiken können geändert werden, indem man auf die Darstellung klickt und im sich öffnenden Dialogfenster „Inhalte bearbeiten" ansteuert. Dort lässt sich dann bestimmen wo und welche Änderungen stattfinden sollen.
Durch das Anklicken von Tabellen und Grafiken und anschließendem Betätigen der rechten Maustaste lassen sich diese Outputs kopieren und in andere Programme integrieren.
6. Resümee und Hinweis
Bei der Verarbeitung der Befragungsergebnisse mit SPSS führte der Bio-Landwirt im Wesentlichen folgende Arbeitsschritte durch:
- Erstellen eines Codierungsschemas
- Übertragen des Codierungsschemas in die Variablenansicht und Modifizieren der einzelnen Spalten und Zellen in die Variablenansicht sowie Festlegen des Messniveaus
- Eingabe der Merkmalsausprägungen und damit Erfassen der Daten in der Datenansicht
- Analysieren der Daten und grafische Darstellung der Daten mit Hilfe der Menüleiste und Bedienung der aufgerufenen Dialogfenster
Der ausgezeichnete Bedienkomfort sowie die umfassenden Funktionen machen SPSS zu einem sehr beliebten und etablierten Statistikprogramm der Forschung, Wirtschaftspraxis und Lehre.
Das Benutzerinterface ist sogar für Einsteiger einfach und intuitiv zu bedienen. Die Arbeitsergebnisse werden in SPSS übersichtlich in präsentationsfähigen Tabellen dargestellt. Diese Tabellen können anschließend bearbeitet werden. SPSS verfügt über alle gängigen Graphiktypen. Das System bietet dem Nutzer zur Unterstützung Tutorials und Hilfetexte an.
SPSS basiert auf der Programmiersprache „Java" und ist modular aufgebaut. IBM SPSS Statistics Base und die anderen Module von SPSS bieten ein beeindruckendes Repertoire statistischer Funktionen, das kaum noch Wünsche offen läßt.
Möchte man SPSS nutzen, müssen Lizenzgebühren, Hardwareanforderungen und eine nicht ganz einfache Programmaktivierung akzeptiert werden. Von daher mag die Prüfung lizenzkostenfreier Alternativen zu SPSS im Einzelfalle durchaus Sinn machen (z. B. Gretl, Instat+, Gnu_R, Statistiklabor, OpenStat u. a.).
Axel Baumann, 2010
Literaturverzeichnis
Backhaus, K., Erichson, B., Plinke, W., Weiber, R., Multivariate Analysemethoden, Eine anwendungsorientierte Einführung, 11. Auflage, Berlin 2006
Baumann, A., Wagner, G., Einstieg in die Marktforschung, Sternenfels 2010
Baur, N., Fromm, S., Datenanalyse mit SPSS für Fortgeschrittene, Wiesbaden 2004
Bühl, A., SPSS 16, Einführung in die moderne Datenanalyse, München 2008
Brosius, F., SPSS-Programmierung - Effizientes Datenmanagement und Automatisierung mit SPSS-Syntax, 2005
Eckstein, P.P., SPSS Arbeitsbuch, Wiesbaden 2000
Eckstein, P.P., Angewandte Statistik mit SPSS, Wiesbaden 2004
Janson, J., Laatz, W., Statistische Datenanalyse mit SPSS für Windows, Hamburg 2005
Kähler, W.-M., Statistische Datenanalyse, Verfahren verstehen und mit SPSS gekonnt einsetzen, Wiesbaden 2008
Martens, J., Statistische Datenanalyse mit SPSS für Windows, Oldenburg 2003.
Schendera, C., Datenmanagement mit SPSS, München, Wien 2007
Wittenberg, R., Cramer, H., Datenanalyse mit SPSS für Windows, Stuttgart 2003
Zöfel, P., SPSS Syntax, München 2002
[1] SPSS = Superior Performance Software System (heute) oder Statistical Package for the Social Sciences (ursprünglich 1968). Seit Sommer 2010 ist SPSS in der Version 19 verfügbar.
[2] Vgl. hierzu auch die Richtlinien der Royal Statistical Society und der American Statistical Association.
[3] Weitere Darstellungen der Verarbeitung von Befragungsergebnissen mit IBM SPSS sind geplant. Daher ist dieser Artikel eine erste knappe Abhandlung dieser Thematik. Abbildungen von SPSS konnten in diesen Online-Artikel nicht eingebaut werden.
[4] Beobachtungseinheiten können Individuen oder Objekte wie z. B. Firmen, Regionen sein, aber auch bestimmte definierte Situationen wie z. B. Transaktionen.
[5] Zur Stichprobentheorie und der optimalen Stichprobenbildung vgl. die einschlägige Fachliteratur - dies ist aufgrund des hier getroffenen Schwerpunkts nicht Gegenstand des Artikels.
[6] Die hier dargestellten Fragebogen-Inhalte dienen ausschließlich der Illustration der weiteren Ausführungen. Diese Fragebogen-Inhalte sollen keine Empfehlung oder Referenz eines Marketingprojekts darstellen.
[7] Das zu definierende Feld wird angeklickt und die erscheinende Dialogbox wird bearbeitet.
Die hier nicht beschriebenen Spaltenanpassungen funktionieren analog. In diesem Artikel werden schwerpunktmäßig zentrale Spalten beschrieben.
[8] Müssen für einzelne Variablen die gleichen Wertelabels definiert werden, dann können die durchgeführten Definitionen automatisch auf die weiteren Variablen übertragen werden. Man öffnet „Datei" und „Variableneigenschaften definieren". Daraufhin erscheint ein Dialogfenster in dem man die Variablen auswählt, die nun die gleichen Definitionen der Wertelabels erhalten sollen. Alle diese Variablen werden in ein Fenster in der Dialogbox geschoben („Zu durchsuchende Variablen:"). Mit „Weiter" öffnet sich ein nächstes Dialogfenster, in dem die Definition der Wertelabels für eine Variable vorgenommen und mit anklicken von „Zu anderen Variable…" auf die anderen Variablen übertragen wird.
[9] Falls man dem System keine andere Behandlung fehlender Werte vorgegeben hat (vgl. Abbildung 5 Spalte „Fehlende …"). Die Behandlung fehlender Werte wird in diesem Artikel ausgeklammert und muss der Spezialliteratur vorbehalten bleiben. Ebenso muss aufgrund des Schwerpunktes des Artikels auf die Handbücher von SPSS verwiesen werden, wenn es um das Transformieren, Umkodieren, Gewichten der Daten und das Erzeugen neuer Variablen sowie das Auswählen von Fällen geht.
[10] Das System bietet noch weitere Kontrollprozeduren an. Diese Kontrollmöglichkeiten müssen den weiterführenden Handbüchern und der Spezialliteratur aufgrund der Schwerpunktsetzung dises Artikels überlassen werden.
[11] Zur Integration von Dateien anderer Systeme in SPSS sei auf die Handbücher verwiesen. Der Schwerpunkt dieses Artikels klammert diese Möglichkeit aus.