Stata – Statistical Software for Professionals

Stata ist ein umfangreiches statistisches Softwarepaket für den Einsatz in Forschung und Entwicklung. Stata bietet ein breites Spektrum an hochwertigen statistischen Methoden aller Disziplinen. Insbesondere Forscher aus den Bereichen Soziologie, Ökonomie, Politik- und Sozialwissenschaft sowie Epidemiologie und anderen medizinischen Fachgebieten finden in Stata die benötigten Verfahren und mehr.
Stata kann in Windows-, Mac- und Unix-Umgebungen genutzt werden. Stata gibt es in den Editionen
Stata erleichtert Ihnen den Einstieg und hält Sie mit umfangreichen Ressourcen auf dem aktuellsten Stand:
- Stata Journal (vierteljährlich erscheinende Publikation mit Artikeln, Tipps und Tricks zu Statistik, Datenanalyse und der Stata-eigenen Programmiersprache „Mata“)
- Stata News (kostenlos für registrierte Stata-Anwender)
- Stata Training – Sie möchten schnell und effektiv einsteigen? Besuchen Sie unsere Stata-Workshops

Feature highlights Stata 16
Wir freuen uns, Ihnen die größten Neuerungen in Stata 16 vorstellen zu können. In der nachfolgenden Liste finden Sie die Highlights der Version. Die Mehrzahl dieser Features ist für Forscher aller Disziplinen spannend.
blank
Lasso
Lasso ist eine maschinelle Lerntechnik, die zur Modellauswahl, Vorhersage und Inferenz verwendet wird.
Der neue -lasso-Befehl wählt abweichungsbasierte „optimale“ Prädiktoren für kontinuierliche, binäre und Häufigkeits-Ergebnisse aus.
Wenn Sie beispielsweise
. lasso linear y x1-x500
eingeben, wählt Lasso eine Teilmenge der angegebenen Kovariaten aus; z. B. x2, x10, x11 und x21. Mit dem standard -predict-Befehl erhalten Sie anschließend Vorhersagen von y.
Sollten Sie es vorziehen, Variablen mittels elastischer Netze oder des Quadratwurzel basierter Methoden auszuwählen, können Sie die Befehle -elasticnet- oder -sqrtlasso- in gleicher Weise verwenden.
Manchmal ist die Variablenauswahl oder die Vorhersage bereits das Endziel von Lasso. Andere Male steht jedoch das Schätzen und Testen von Koeffizienten im Mittelpunkt. Hierfür stehen Ihnen in Stata 16 elf weitere Befehle mit denen Sie Koeffizienten, Standardfehler und Konfidenzintervalle schätzen sowie Tests für interessierende Variablen bei Verwendung von Lasso-Methoden durchführen können. Die Befehle sind
dsregress, dslogit, dspoisson, poregress, pologit, popoisson, poivpoisson, xporegress, xpologit,
xpopoisson und xpoivregress.
Die -ds-Befehle führen ein Lasso mit doppelter Auswahl durch, mit den Befehlen -po- wird ein Partialing-Out-Lasso ausgeführt. Die -xpo-Befehle führen schließlich ein Cross-Fit-Partialing-Out-Lasso durch. Dies tun sie für Modelle mit kontinuierlichen, binären und Zähldaten. In Modellen für kontinuierliche abhängige Variablen können sie sogar endogene Kovariaten berücksichtigen.
Während viele der neueren Lasso-Methoden insbesondere in der Ökonometrie entwickelt werden, erfreuen sie sich in allen Disziplinen wachsender Beliebtheit, da sie auch im Bereich des maschinellen Lernens Möglichkeiten des formalen Testens und der inhaltlichen Interpretation von interessierenden Variablen bieten. Erfahren Sie im neuen Lasso-Referenzhandbuch auf anschauliche Weise alles über die Lasso-Funktionen in Stata 16.
Python integration
In Stata 16 können Sie Python-Code in Stata einbetten und ausführen. Mit dem neuen -python-Befehl können Sie Python einfach aus Stata heraus aufrufen und die Python-Ergebnisse anschließend in Stata ausgeben. Sie können Python sowohl interaktiv über das Kommandofenster als auch über do- bzw. ado-Files aufrufen, um die umfangreichen Funktionen von Python zu nutzen. Ebenso können sie auch Python-Skriptdateien (.py) direkt über Stata ausführen. Für die nahtlose Integration steht Ihnen darüber hinaus das Stata Function Interface (sfi) Python-Modul zur Verfügung. Dieses Modul schafft die bidirektionale Verbindung zwischen Stata und Python und ermöglicht so direkten Zugriff auf die aktuell geöffneten Datensätze (siehe unten), Frames, Makros, Skalare, Matrizen, Wertelabels, Merkmale, globale Mata-Matrizen und mehr. All dies bedeutet, dass Sie jetzt jedes Python-Paket direkt in Stata verwenden können. Mit Matplotlib können Sie beispielsweise dreidimensionale Grafiken erstellen. Oder Sie verwenden NumPy für numerische Berechnungen. Mit Scrapy können Sie Daten direkt aus dem Web sammeln und in Stata verwenden. Und über TensorFlow sowie scikit-learn können Sie zusätzliche Verfahren maschinellen Lernens wie neuronale Netze oder Vektormaschinen verwenden. Und vieles mehr. Um die volle Power dieser neuen Möglichkeiten auszuschöpfen, beinhaltet Statas Do-File-Editor schließlich auch Syntaxhervorhebung für Python. Insgesamt kommen somit nicht nur fortgeschrittene Programmierer in den Genuss der Vorteile der neuen Python-Integration, sondern werden noch viel mehr Benutzer aller Disziplinen über die Verfügbarkeit von Python in Stata begeistert sein.
Import data from SAS and SPSS
Darüber hinaus können Sie mit den neuen Befehlen -import sasxport8- und -export sasxport8- SAS XPORT-Transportdateien nun auch in der Version 8 direkt mit Stata verwenden.
Choice models
blank
New in Bayesian analysis—Multiple chains, predictions, and more
. bayes, nchains(4): regress y x1 x2
ein werden vier unabhängige Ketten simuliert. Die Ketten werden automatisch kombiniert, um ein genaueres Endergebnis zu erzielen. Vor der Ergebnisinterpretation können Sie die Ketten auch grafisch vergleichen, um die Konvergenz zu bewerten. Oder Sie bewerten die Konvergenz mittels der Gelman-Rubin-Konvergenzdiagnose, die nun von -bayes: regress- und anderen Bayes-Schätzbefehlen bei multiplen Ketten berichtet wird. Wenn Sie daraufhin immer noch Bedenken hinsichtlich Nichtkonvergenz haben, können Sie mit dem Befehl -bayesstats grubin- noch genauer nachforschen und individuelle Gelman-Rubin-Diagnostiken für jeden Parameter Ihres Modells durchführen. Bayes‘sche Vorhersagen:Bayes’sche Vorhersagen sind simulierte Werte aus der posterioren Vorhersageverteilung. Diese Vorhersagen sind nützlich, um die Modellgüte zu überprüfen sowie Beobachtungen außerhalb der Stichprobe vorherzusagen. Nachdem Sie ein Modell mit -bayesmh- geschätzt haben, können Sie nun -bayespredict- verwenden, um diese simulierten Werte oder Funktionen zu berechnen und in einem neuen Datensatz zu speichern. Beispielsweise können Sie Minimum und Maximum der simulierten Werte berechnen. Anschließend können Sie andere postestimation Befehle wie -bayesgraph- verwenden, um Zusammenfassungen der Vorhersagen zu erhalten.Der von -bayespredict- erzeugte Datensatz kann Tausende von simulierten Werten für jede Beobachtung in Ihrem Datensatz enthalten. Mitunter brauchen Sie jedoch nicht alle Einzelwerte. Um stattdessen Zusammenfassungen wie beispielsweise posteriore Mittelwerte oder Mediane zu erhalten, können Sie auch -bayespredict, pmean- oder -bayespredict, pmedian- verwenden. Alternativ könnten Sie an einer Zufallsauswahl der simulierten Werte interessiert sein. Hierzu können Sie beispielsweise -bayesreps, nreps(100)- verwenden, um 100 Replikate zufällig auszuwählen. Und mehr:Schließlich möchten Sie möglicherweise die Anpassungsgüte des Modells unter Verwendung posteriorer prädiktiver p-Werte (auch als PPPs oder Bayes’sche prädiktive p-Werte bezeichnet) bewerten. PPPs messen die Übereinstimmung zwischen den beobachteten und replizierten Daten und können mit dem neuen Befehl -bayesstats ppvalues- berechnet werden.
Manuskripterstellung & Reporting
Neue Berichtsfunktionen in Stata 16:
Mit den Befehlen -dyndoc- und -markdown- erstellen Sie zusätzlich zu den bisherigen HTML-Dokumenten nun auch Word-Dokumente. Dadurch können Sie nun noch einfacher vollständige Stata-Ergebnisse und Grafiken in Markdown-Text einbinden, um benutzerdefinierte Word-Dokumente zu erstellen.
Hierfür bietet der Do-File-Editor jetzt auch Syntaxhervorhebung speziell für Markdown.
Mit dem -putdocx-Befehl können Sie jetzt außerdem auch Kopf- und Fußzeilen inklusive Seitenzahlen einrichten. Darüber hinaus ist es jetzt auch einfacher mit dem Befehl längere Absätze zu schreiben.
Schließlich wandelt der -html2docx-Befehl HTML-Dokumente, einschließlich CSS, in Word-Dokumente um. Der Befehl -docx2pdf- konvertiert Word-Dokumente im Handumdrehen in PDF-Dateien.
Multiple datasets in memory
. frame create laender
. frame laender: use laender
ein und schon haben Sie zwei Datensätze im Speicher geöffnet. Das gleichzeitige Arbeiten mit mehreren Datensätzen war ein viel gewünschtes Feature unserer Nutzer. Besonders mächtig wird es jedoch durch das einfache Verlinken verbundener Datenstrukturen. Stellen Sie sich beispielsweise vor, dass beide Datensätze die Variable „bundesland“ beinhalten, welche die Bundesländer auf dieselbe Weise identifiziert. Indem Sie einfach
. frlink m:1 bundesland, frame(laender)
eingeben, sind alle Teilnehmenden im default-Frame mit einem Bundesland im laender-Frame verknüpft. Nun können Sie spielend einfach Variablen zwischen Frames kopieren oder mit der Funktion -frval()-direkt auf Werte von Variablen in gelinkten Frames zuzugreifen. Beispielsweise könnten Sie mit dem Befehl:
. generate rel_einkommen = einkommen / frval(laender, median_einkommen)
aus dem individuellen Teilnehmer-Einkommen sowie dem Median des Einkommens im jeweiligen Bundesland direkt eine neue Variable mit dem relativen Einkommen erzeugen. Und das ist erst der Anfang: Während dieses Beispiel lediglich zwei Frames verwendet, können Sie bis zu 100 Frames gleichzeitig laden und zahlreiche Links zwischen den jeweiligen Frames erstellen.
Weitere Neuigkeiten in Stata 16
Panel-data ERMs
Meta-analysis
Nonparametric series regression
Sample-size analysis for confidence intervals
Nonlinear DSGE models
Multiple-group IRT models
xtheckman
Multiple-dose pharmacokinetic modeling
Heteroskedastic ordered probit models
Graph sizes in printer points, centimeters, and inches
Numerical integration
Linear programming
Stata in Korean
Mac interface now supports Dark Mode and native tabbed windows
Do-file Editor—Autocompletion and more syntax highlighting
Jetzt ein unverbindlichen Stata 16 Upgrade-Angebot anfordern
Einsatzbereiche
Your Research. Stata Software.
A Beautiful Solution.
Wissenschaftler verschiedenster Disziplinen setzen seit mehr als 30 Jahren auf Stata Software. Und das mit Erfolg, denn Stata bietet ihnen alles, was sie im Bereich Statistik, Grafik und Datenmanagement benötigen.
Womit beschäftigen Sie sich? Finden Sie heraus, was Stata für Sie tun kann:
Public Health, Biostatistik, Bildung, Wirtschaftswissenschaft, Medizin, Verhaltenswissenschaften, Public Policy, Finanzen, Business & Marketing, Epidemiologie, Soziologie, Data science, Institutional research, Politikwissenschaft

User Programme
Befehle, die von der Community bereitgestellt wurden
Die Anzahl der verfügbaren von der Community bereitgestellten Befehlen steigt immer weiter an. Sollte es heute noch keinen Befehl für Ihre Anforderungen geben, dann aber vielleicht in Kürze.
Aus Stata heraus können Sie, die von der Community bereitgestellten Befehle leicht finden, indem Sie mit findit eine Suche auf der Basis von bestimmten Schlagworten starten. Wenn Sie z.B. ein Forest-Plot erzeugen wollen (kommt häufig in Meta-Analysen vor), geben Sie ein:
.findit forest plot
Sie erhalten eine Liste von passenden Befehlen und können auf die blauen Links klicken, um mehr Informationen darüber zu erhalten und um sie zu installieren.
Wenn Sie Stata noch nicht besitzen, können Sie im SSC archive suchen. Dieses Archiv enthält sehr viele – wenn auch nicht alle – anwendergeschriebenen Befehle.
Wir möchten hier auf einige Kategorien von der Community bereitgestellten Befehlen aufmerksam machen:
blank
Meta-Analysen
Behandlungseffekte
Nearest-neighbor, Propensity-score-matching, Kommandos für die Bewertung der Empfindlichkeit der Schätzer in bezug auf Verletzung der verschiedensten Voraussetzungen, Kommandos für Erweiterungen des Basismodells auf multinomiale Behandlungen, wo das einzele Subjekt eine von verschiedenen alternativen Behandlungen erhalten kann.
Ergebnis-Ausgaben
Modelle mit eingeschränkten abhängigen Variablen
Von der Community bereitgestellte Befehle für eingeschränkte abhängige Variable sind für Cross-Sectional-, Panel- und Multilevel-Daten verfügbar.
Survivalanalyse
Cure- und relative Risk-Modelle, Competing Risk-Modelle, proportionale Hazard-Modelle mit diskreter Zeit, flexible parametrische Modelle.
blank
Statistische Grafiken
Spezialisierte Regressions-Diagnostikplots, Plots der kumulativen Verteilung einer Variablen, Zyklusplots zur Untersuchung der Saisonalität, Spineplots von kategorialen Zwei-Wege-Daten, Bland-Altman-Plot zum Vergleich von zwei Untersuchungen, Choropleth zur räumlichen Darstellung der Armut u.a.
Datenmanagement
Multilevel und korrelierte Daten
Ökonometrie
Multiple Imputation
Außerdem...
Wenn Sie sehen möchten, was Anwender am häufigsten unter SSC gesucht haben, geben Sie in Stata ein:
.ssc whatshot
Der neue Befehl ssc whatshot listet die populärsten von der Community bereitgestellte Befehle unter SSC auf, die heruntergeladen wurden. Es werden die 10 häufigsten Befehle angezeigt. Wenn Sie ssc whatshot, n(15) eingeben, erscheinen die Top 15. Mit ssc whatshot, author(cox) erhalten Sie die Top 10 Befehle von Autoren mit dem Namen „Cox“.
Stata for Windows
- Windows 10*
- Windows 8*
- Windows 7*
- Windows Server 2019, 2016, 2012, 2008*
* 64-bit for x86-64 made by Intel® and AMD
Stata for Mac
- Stata for Mac requires 64-bit Intel® processors (Core 2 Duo or better) running macOS 10.11 or newer
Stata for Linux
- 64-bit (x86-64)
- For xstata, you need to have GTK 2.24 installed
Hardware-requirements
- Minimum of 1 GB of RAM für IC, 2 GB RAM für SE, 4 GB RAM für MP
- Minimum of 1 GB of disk space
- Stata for Unix requires a video card that can display thousands of colors or more (16-bit or 24-bit color)
Hardware-Empfehlungen für Dual-core-, Multi-core oder Multiprozessor-Computer
Updates
Sie möchten Ihre Stata-Version auf den aktuellsten Stand bringen? Geben Sie dafür im Programm update query ein - bei bestehender Internetverbindung -, daraufhin wird Stata Ihnen anzeigen, ob Updates verfügbar sind und wie Sie weiter vorgehen können.
Sollten Sie in Stata keine Internetverbindung haben, erhalten Sie hier die für Ihre Stata-Version verfügbaren Updates:
Kostenfreie Updates für Stata 15
Kostenfreie Updates für Stata 14
Kostenfreie Updates für Stata 13
Kostenfreie Updates für Stata 12
Kostenfreie Updates für Stata 11
Bitte laden Sie die Stata-Executables und ado-Files für Ihr Betriebssystem herunter.
Stata Press
Stata Press - Stata's in-house Verlag - bietet Ihnen Fachbücher rund um Stata und verschiedene statistische Themen. Vom Anfänger bis zum erfahrenen Anwender, von Soziologie über Medizin bis zu Betriebs- und Finanzwirtschaft ist für jeden etwas dabei.
Auch die Stata Dokumentation und das vierteljährlich erscheinende Stata Journal werden von Stata Press heraus gegeben. Die beliebtesten Publikationen gibt es im praktischen eBook-Format.
Alle Stata Press Bücher und eBooks erhalten Sie bei uns im Online-Shop
Stata Einsteiger
Dieses Angebot richtet sich alle Neulinge und "blutigen Anfänger" in der quantitativen Datenanalyse.
Stata Könner
Effektives Arbeiten mit Stata und Einführung in die statistische Modellierung
Stata Profi
Mehrebenen-Modellierung, Längsschnittliche Modellierung van Paneldaten und Strukturgleichungsmodellierung
Stata NetCourses und Online-Tutorials
Stata NetCourses
Kostengünstige E-Learning-Kurse mit Themen rund um Stata, angeboten und durchgeführt von StataCorp LP.
Online-Tutorials
Videos und Playlists zu Analysen, Methoden und Einsatzbereichen von Stata auf Statas YouTube-Channel.
Stata Spickzettel
Benötigen Sie ein wenig Unterstützung bei den Stata-Grundlagen?
Suchen Sie nicht weiter, sondern schauen Sie sich die Stata Spickzettel der Datenspezialisten Dr. Tim Essam und Dr. Laura Hughes an.
Diese 6 Seiten decken alles ab, was Sie benötigen, von der Syntax- und Datenverarbeitung über das Plotten und Programmieren und machen sie zu nützlichen Referenzen für den schnellen Download.