Stata – Statistical Software for Professionals

NEU IN Stata 16

Stata ist ein umfangreiches statistisches Softwarepaket für den Einsatz in Forschung und Entwicklung. Stata bietet ein breites Spektrum an hochwertigen statistischen Methoden aller Disziplinen. Insbesondere Forscher aus den Bereichen Soziologie, Ökonomie, Politik- und Sozialwissenschaft sowie Epidemiologie und anderen medizinischen Fachgebieten finden in Stata die benötigten Verfahren und mehr.

Stata kann in Windows-, Macintosh- und Unix-Umgebungen genutzt werden. Stata gibt es in den Editionen

Stata erleichtert Ihnen den Einstieg und hält Sie mit umfangreichen Ressourcen auf dem aktuellsten Stand:

  • Stata Journal (vierteljährlich erscheinende Publikation mit Artikeln, Tipps und Tricks zu Statistik, Datenanalyse und der Stata-eigenen Programmiersprache „Mata“)
  • Stata News (kostenlos für registrierte Stata-Anwender)
  • Stata Training – Sie möchten schnell und effektiv einsteigen? Besuchen Sie unsere Stata-Workshops

Feature highlights Stata 16

Wir freuen uns, Ihnen die größten Neuerungen in Stata 16 vorstellen zu können. In der nachfolgenden Liste finden Sie die Highlights der Version. Die Mehrzahl dieser Features ist für Forscher aller Disziplinen spannend.

blank
Lasso

 

Lasso ist eine maschinelle Lerntechnik, die zur Modellauswahl, Vorhersage und Inferenz verwendet wird.
Der neue -lasso-Befehl wählt abweichungsbasierte „optimale“ Prädiktoren für kontinuierliche, binäre und Häufigkeits-Ergebnisse aus.
Wenn Sie beispielsweise
. lasso linear y x1-x500

eingeben, wählt Lasso eine Teilmenge der angegebenen Kovariaten aus; z. B. x2, x10, x11 und x21. Mit dem standard -predict-Befehl erhalten Sie anschließend Vorhersagen von y.
Sollten Sie es vorziehen, Variablen mittels elastischer Netze oder des Quadratwurzel basierter Methoden auszuwählen, können Sie die Befehle -elasticnet- oder -sqrtlasso- in gleicher Weise verwenden.
 
Manchmal ist die Variablenauswahl oder die Vorhersage bereits das Endziel von Lasso. Andere Male steht jedoch das Schätzen und Testen von Koeffizienten im Mittelpunkt. Hierfür stehen Ihnen in Stata 16 elf weitere Befehle mit denen Sie Koeffizienten, Standardfehler und Konfidenzintervalle schätzen sowie Tests für interessierende Variablen bei Verwendung von Lasso-Methoden durchführen können. Die Befehle sind
dsregress, dslogit, dspoisson, poregress, pologit, popoisson, poivpoisson, xporegress, xpologit,
xpopoisson und xpoivregress.
Die -ds-Befehle führen ein Lasso mit doppelter Auswahl durch, mit den Befehlen -po- wird ein Partialing-Out-Lasso ausgeführt. Die -xpo-Befehle führen schließlich ein Cross-Fit-Partialing-Out-Lasso durch. Dies tun sie für Modelle mit kontinuierlichen, binären und Zähldaten. In Modellen für kontinuierliche abhängige Variablen können sie sogar endogene Kovariaten berücksichtigen.
 
Während viele der neueren Lasso-Methoden insbesondere in der Ökonometrie entwickelt werden, erfreuen sie sich in allen Disziplinen wachsender Beliebtheit, da sie auch im Bereich des maschinellen Lernens Möglichkeiten des formalen Testens und der inhaltlichen Interpretation von interessierenden Variablen bieten. Erfahren Sie im neuen Lasso-Referenzhandbuch auf anschauliche Weise alles über die Lasso-Funktionen in Stata 16.

 

Python integration

 

In Stata 16 können Sie Python-Code in Stata einbetten und ausführen. Mit dem neuen -python-Befehl können Sie Python einfach aus Stata heraus aufrufen und die Python-Ergebnisse anschließend in Stata ausgeben. Sie können Python sowohl interaktiv über das Kommandofenster als auch über do- bzw. ado-Files aufrufen, um die umfangreichen Funktionen von Python zu nutzen. Ebenso können sie auch Python-Skriptdateien (.py) direkt über Stata ausführen. Für die nahtlose Integration steht Ihnen darüber hinaus das Stata Function Interface (sfi) Python-Modul zur Verfügung. Dieses Modul schafft die bidirektionale Verbindung zwischen Stata und Python und ermöglicht so direkten Zugriff auf die aktuell geöffneten Datensätze (siehe unten), Frames, Makros, Skalare, Matrizen, Wertelabels, Merkmale, globale Mata-Matrizen und mehr. All dies bedeutet, dass Sie jetzt jedes Python-Paket direkt in Stata verwenden können. Mit Matplotlib können Sie beispielsweise dreidimensionale Grafiken erstellen. Oder Sie verwenden NumPy für numerische Berechnungen. Mit Scrapy können Sie Daten direkt aus dem Web sammeln und in Stata verwenden. Und über TensorFlow sowie scikit-learn können Sie zusätzliche Verfahren maschinellen Lernens wie neuronale Netze oder Vektormaschinen verwenden. Und vieles mehr. Um die volle Power dieser neuen Möglichkeiten auszuschöpfen, beinhaltet Statas Do-File-Editor schließlich auch Syntaxhervorhebung für Python. Insgesamt kommen somit nicht nur fortgeschrittene Programmierer in den Genuss der Vorteile der neuen Python-Integration, sondern werden noch viel mehr Benutzer aller Disziplinen über die Verfügbarkeit von Python in Stata begeistert sein.

Import data from SAS and SPSS

Mit den neuen Befehlen -import sas- und -import spss- in Stata 16 können Sie nun auch direkt Daten im SAS- (.sas7bdat) und SPSS-Format (.sav) verwenden. Visuelle Dialoge erleichtern Ihnen den Import mit einer Vorschau der Daten sowie bei Bedarf auch das Auswählen einer Teilmenge von Variablen und Beobachtungen.

Darüber hinaus können Sie mit den neuen Befehlen -import sasxport8- und -export sasxport8- SAS XPORT-Transportdateien nun auch in der Version 8 direkt mit Stata verwenden.

Choice models

In Stata 16 führen wir eine neue, einheitliche Suite von Befehlen für die Auswahlmodellierung ein. Dafür haben wir neue Befehle für die deskriptive Statistik von Auswahldaten ergänzt. Darüber hinaus haben wir vorhandene Befehle zur Schätzung von Auswahlmodellen vereinheitlicht und verbessert. Wir haben sogar einen neues Verfahren zum Schätzen von Mixed-Logit-Modellen für Paneldaten hinzugefügt. Und wir dokumentieren sie gemeinsam im neuen Choice Models Reference Manual. Und das Beste daran: -margins- funktioniert jetzt auch nach der Schätzung von Choice-Modellen. Das bedeutet, dass Sie Ihre Ergebnisse jetzt auf einfache Weise interpretieren können. Während die in der Auswahlmodellierung geschätzten Koeffizienten häufig kaum interpretierbar sind, können Sie mit -margins- auf Grundlage Ihrer Ergebnisse sehr spezifische Fragen stellen und beantworten.

blank
New in Bayesian analysis—Multiple chains, predictions, and more

Mehrere Ketten:Bayesianische Inferenz basierend auf einer MCMC (Markov chain Monte Carlo) Stichprobe ist nur gültig, wenn die Markov-Kette konvergiert hat. Eine Möglichkeit, diese Konvergenz zu bewerten, besteht darin, mehrere Ketten zu simulieren und zu vergleichen. Mit der neuen Option -nchains ()- können Sie dies sowohl mit dem -bayes:-Prefix als auch mit dem Befehl -bayesmh- durchführen.Geben Sie beispielsweise den Befehl
. bayes, nchains(4): regress y x1 x2

ein werden vier unabhängige Ketten simuliert. Die Ketten werden automatisch kombiniert, um ein genaueres Endergebnis zu erzielen. Vor der Ergebnisinterpretation können Sie die Ketten auch grafisch vergleichen, um die Konvergenz zu bewerten. Oder Sie bewerten die Konvergenz mittels der Gelman-Rubin-Konvergenzdiagnose, die nun von -bayes: regress- und anderen Bayes-Schätzbefehlen bei multiplen Ketten berichtet wird. Wenn Sie daraufhin immer noch Bedenken hinsichtlich Nichtkonvergenz haben, können Sie mit dem Befehl -bayesstats grubin- noch genauer nachforschen und individuelle Gelman-Rubin-Diagnostiken für jeden Parameter Ihres Modells durchführen. Bayes‘sche Vorhersagen:Bayes’sche Vorhersagen sind simulierte Werte aus der posterioren Vorhersageverteilung. Diese Vorhersagen sind nützlich, um die Modellgüte zu überprüfen sowie Beobachtungen außerhalb der Stichprobe vorherzusagen. Nachdem Sie ein Modell mit -bayesmh- geschätzt haben, können Sie nun -bayespredict- verwenden, um diese simulierten Werte oder Funktionen zu berechnen und in einem neuen Datensatz zu speichern. Beispielsweise können Sie Minimum und Maximum der simulierten Werte berechnen. Anschließend können Sie andere postestimation Befehle wie -bayesgraph- verwenden, um Zusammenfassungen der Vorhersagen zu erhalten.Der von -bayespredict- erzeugte Datensatz kann Tausende von simulierten Werten für jede Beobachtung in Ihrem Datensatz enthalten. Mitunter brauchen Sie jedoch nicht alle Einzelwerte. Um stattdessen Zusammenfassungen wie beispielsweise posteriore Mittelwerte oder Mediane zu erhalten, können Sie auch -bayespredict, pmean- oder -bayespredict, pmedian- verwenden. Alternativ könnten Sie an einer Zufallsauswahl der simulierten Werte interessiert sein. Hierzu können Sie beispielsweise -bayesreps, nreps(100)- verwenden, um 100 Replikate zufällig auszuwählen. Und mehr:Schließlich möchten Sie möglicherweise die Anpassungsgüte des Modells unter Verwendung posteriorer prädiktiver p-Werte (auch als PPPs oder Bayes’sche prädiktive p-Werte bezeichnet) bewerten. PPPs messen die Übereinstimmung zwischen den beobachteten und replizierten Daten und können mit dem neuen Befehl -bayesstats ppvalues- berechnet werden.

Manuskripterstellung & Reporting

Mit den Berichtsfunktionen von Stata können Sie Word-, PDF-, Excel- und HTML-Dokumente erstellen, die Stata-Ergebnisse und -Diagramme mit formatiertem Text und Tabellen enthalten. Unabhängig von der Art des von Ihnen erstellten Dokuments können Sie sich auf die integrierten Versionsfunktionen von Stata verlassen, um sicherzustellen, dass Ihre Berichte reproduzierbar sind.

Neue Berichtsfunktionen in Stata 16:
Mit den Befehlen -dyndoc- und -markdown- erstellen Sie zusätzlich zu den bisherigen HTML-Dokumenten nun auch Word-Dokumente. Dadurch können Sie nun noch einfacher vollständige Stata-Ergebnisse und Grafiken in Markdown-Text einbinden, um benutzerdefinierte Word-Dokumente zu erstellen.
Hierfür bietet der Do-File-Editor jetzt auch Syntaxhervorhebung speziell für Markdown.
Mit dem -putdocx-Befehl können Sie jetzt außerdem auch Kopf- und Fußzeilen inklusive Seitenzahlen einrichten. Darüber hinaus ist es jetzt auch einfacher mit dem Befehl längere Absätze zu schreiben.
Schließlich wandelt der -html2docx-Befehl HTML-Dokumente, einschließlich CSS, in Word-Dokumente um. Der Befehl -docx2pdf- konvertiert Word-Dokumente im Handumdrehen in PDF-Dateien.

Multiple datasets in memory

Sie können jetzt mehrere Datensätze in den Speicher laden. Geben Sie wie gewohnt -use teilnehmer- ein und teilnehmer.dta wird geladen. Geben Sie als Nächstes

. frame create laender

. frame laender: use laender

ein und schon haben Sie zwei Datensätze im Speicher geöffnet. Das gleichzeitige Arbeiten mit mehreren Datensätzen war ein viel gewünschtes Feature unserer Nutzer. Besonders mächtig wird es jedoch durch das einfache Verlinken verbundener Datenstrukturen. Stellen Sie sich beispielsweise vor, dass beide Datensätze die Variable „bundesland“ beinhalten, welche die Bundesländer auf dieselbe Weise identifiziert. Indem Sie einfach

. frlink m:1 bundesland, frame(laender)

eingeben, sind alle Teilnehmenden im default-Frame mit einem Bundesland im laender-Frame verknüpft. Nun können Sie spielend einfach Variablen zwischen Frames kopieren oder mit der Funktion -frval()-direkt auf Werte von Variablen in gelinkten Frames zuzugreifen. Beispielsweise könnten Sie mit dem Befehl:

. generate rel_einkommen = einkommen / frval(laender, median_einkommen)

aus dem individuellen Teilnehmer-Einkommen sowie dem Median des Einkommens im jeweiligen Bundesland direkt eine neue Variable mit dem relativen Einkommen erzeugen. Und das ist erst der Anfang: Während dieses Beispiel lediglich zwei Frames verwendet, können Sie bis zu 100 Frames gleichzeitig laden und zahlreiche Links zwischen den jeweiligen Frames erstellen.

Weitere Neuigkeiten in Stata 16

Panel-data ERMs

Meta-analysis

Nonparametric series regression

Sample-size analysis for confidence intervals

Nonlinear DSGE models

Multiple-group IRT models

xtheckman

Multiple-dose pharmacokinetic modeling

Heteroskedastic ordered probit models

Graph sizes in printer points, centimeters, and inches

Numerical integration

Linear programming

Stata in Korean

Mac interface now supports Dark Mode and native tabbed windows

Do-file Editor—Autocompletion and more syntax highlighting

Jetzt ein unverbindlichen Stata 16 Upgrade-Angebot anfordern





Alle mit Sternchen (*) markierten Felder sind Pflichtfelder.



Einsatzbereiche

Your Research. Stata Software.

A Beautiful Solution.

Wissenschaftler verschiedenster Disziplinen setzen seit mehr als 30 Jahren auf Stata Software. Und das mit Erfolg, denn Stata bietet ihnen alles, was sie im Bereich Statistik, Grafik und Datenmanagement benötigen.

Womit beschäftigen Sie sich? Finden Sie heraus, was Stata für Sie tun kann:

Public HealthBiostatistikBildungWirtschaftswissenschaftMedizinVerhaltenswissenschaftenPublic PolicyFinanzen, Business & MarketingEpidemiologieSoziologieData scienceInstitutional researchPolitikwissenschaft

User Programme

Befehle, die von der Community bereitgestellt wurden

Die Anzahl der verfügbaren von der Community bereitgestellten Befehlen steigt immer weiter an. Sollte es heute noch keinen Befehl für Ihre Anforderungen geben, dann aber vielleicht in Kürze.
Aus Stata heraus können Sie, die von der Community bereitgestellten Befehle leicht finden, indem Sie mit findit eine Suche auf der Basis von bestimmten Schlagworten starten. Wenn Sie z.B. ein Forest-Plot erzeugen wollen (kommt häufig in Meta-Analysen vor), geben Sie ein:

.findit forest plot

Sie erhalten eine Liste von passenden Befehlen und können auf die blauen Links klicken, um mehr Informationen darüber zu erhalten und um sie zu installieren.
Wenn Sie Stata noch nicht besitzen, können Sie im SSC archive suchen. Dieses Archiv enthält sehr viele – wenn auch nicht alle – anwendergeschriebenen Befehle.
Wir möchten hier auf einige Kategorien von der Community bereitgestellten Befehlen aufmerksam machen:

blank
Meta-Analysen
In diesem Umfeld existieren eine Reihe von der Community bereitgestellten Befehle wie Tests auf Heterogenität, kumulative gepoolte Schätzer, Meta-Analyse-Regression, Tests auf Publication-Bias, Funnel-Plots, Forest-Plots oder L’Abbe-Plots.
Behandlungseffekte
Schätzer für Behandlungseffekte, die den Einfluss auf ein Ereignis messen, unter Kontrolle von Confounding-Faktoren wie Alter, Geschlecht oder Bildungsniveau:

Nearest-neighbor, Propensity-score-matching, Kommandos für die Bewertung der Empfindlichkeit der Schätzer in bezug auf Verletzung der verschiedensten Voraussetzungen, Kommandos für Erweiterungen des Basismodells auf multinomiale Behandlungen, wo das einzele Subjekt eine von verschiedenen alternativen Behandlungen erhalten kann.

Ergebnis-Ausgaben
Da die verschiedenen Disziplinen und Journale ihren jeweils eigenen Stil haben, gibt es ein breites Spektrum von der Community bereitgestellten Befehle, um diese Bedürfnisse zu befriedigen. Ob Sie Berichte in Word oder LaTeX schreiben oder die Ergebnisse in Excel-Datenblätter überführen wollen, es existiert sicher ein von der Community bereitgestellter Befehle, um Ihre Anforderungen zu erfüllen.
Modelle mit eingeschränkten abhängigen Variablen
Nicht alle abhängigen Variablen sind kontinuierlicher Natur. Einige sind binär. Andere sind geordnet. Manche repräsentieren Zählwerte. Einige sind zensiert. Wieder andere unterliegen der Stichprobenauswahl. Während Stata eine Reihe von Kommandos enthält, um solche Variablen zu verarbeiten, ist die Anzahl der existierenden Modelle unermesslich und steigt fortwährend an. Zum Glück macht es die Stata-eigene Möglichkeit zur Programmierung vom Maximum-Likelihood-Schätzern den Anwendern leicht, neue Modelle unkompliziert zu implementieren.

Von der Community bereitgestellte Befehle für eingeschränkte abhängige Variable sind für Cross-Sectional-, Panel- und Multilevel-Daten verfügbar.

Survivalanalyse
Viele von der Community bereitgestellten Befehle sind verfügbar u.a. für:

Cure- und relative Risk-Modelle, Competing Risk-Modelle, proportionale Hazard-Modelle mit diskreter Zeit, flexible parametrische Modelle.

blank
Statistische Grafiken
Die flexible Grafik-Engine von Stata hat viele Anwender motiviert, eine Vielzahl statistischer Grafiken zu entwickeln:

Spezialisierte Regressions-Diagnostikplots, Plots der kumulativen Verteilung einer Variablen, Zyklusplots zur Untersuchung der Saisonalität, Spineplots von kategorialen Zwei-Wege-Daten, Bland-Altman-Plot zum Vergleich von zwei Untersuchungen, Choropleth zur räumlichen Darstellung der Armut u.a.

Datenmanagement
Die Stata-eigenen Datenmanagement-Möglichkeiten sind sehr vielfältig, es kann aber dennoch passieren, dass sehr spezifische Manipulationen erforderlich sind. Ob Sie z.B. Daten von einem GIS-Programm konvertieren oder die Wertelabel in Ihren Daten bearbeiten müssen, einen linearen Filter anwenden oder eine komplizierte Indikatorvariable erzeugen wollen, ein von der Community bereitgestellte Befehle kann Ihnen vielleicht dabei helfen.
Multilevel und korrelierte Daten
Viele Datendateien enthalten Beobachtungen, die in einer oder mehreren Ebenen hierarchisch angeordent sind. Zusätzlich zu den Stata-eigenen Kommandos für Multilevel Mixed-Effects Lineare Regressions-, Logit- und Poisson-Modelle existieren eine Vielzahl von der Community bereitgestellten Befehle für Multilevel-Daten.
Ökonometrie
Es gibt eine Vielzahl von der Community bereitgestellte Befehle für Instrumental-Variables-Schätzer, Panel-Daten Unit-Root-Tests, Inequality-Measurement und Wage-Decomposition, um nur einige zu nennen.
Multiple Imputation
Es existiert eine Unmenge von der Community bereitgestellte Befehle, um diesen Prozess „idiotensicher“ auszuführen.
Außerdem...
Visualisierung von räumlichen Daten, marginale Effekte, univariate und multivariate statistische Tests. Der Bereich der anwendergeschriebenen Befehle ist so breit und verschieden, wie es die Stata-Anwender selbst sind. Unabhängig von Ihrem Forschungsgebiet gibt es bestimmt einige von der Community bereitgestellte Befehle, das Ihre Stata-Kenntnisse erweitert.

Wenn Sie sehen möchten, was Anwender am häufigsten unter SSC gesucht haben, geben Sie in Stata ein:

.ssc whatshot

Der neue Befehl ssc whatshot listet die populärsten von der Community bereitgestellte Befehle unter SSC auf, die heruntergeladen wurden. Es werden die 10 häufigsten Befehle angezeigt. Wenn Sie ssc whatshot, n(15) eingeben, erscheinen die Top 15. Mit ssc whatshot, author(cox) erhalten Sie die Top 10 Befehle von Autoren mit dem Namen „Cox“.

Stata for Windows

  • Windows 10*
  • Windows 8*
  • Windows 7*
  • Windows Server 2019, 2016, 2012, 2008*

* 64-bit for x86-64 made by Intel® and AMD

Stata for Mac

  • Stata for Mac requires 64-bit Intel® processors (Core 2 Duo or better) running macOS 10.11 or newer

Stata for Linux

    • 64-bit (x86-64)
    • For xstata, you need to have GTK 2.24 installed

Hardware-requirements

        • Minimum of 1 GB of RAM für IC, 2 GB RAM für SE, 4 GB RAM für MP
        • Minimum of 1 GB of disk space
        • Stata for Unix requires a video card that can display thousands of colors or more (16-bit or 24-bit color)

Hardware-Empfehlungen für Dual-core-, Multi-core oder Multiprozessor-Computer

Updates

Sie möchten Ihre Stata-Version auf den aktuellsten Stand bringen? Geben Sie dafür im Programm update query ein - bei bestehender Internetverbindung -, daraufhin wird Stata Ihnen anzeigen, ob Updates verfügbar sind und wie Sie weiter vorgehen können.

Sollten Sie in Stata keine Internetverbindung haben, erhalten Sie hier die für Ihre Stata-Version verfügbaren Updates:

Kostenfreie Updates für Stata 15
Kostenfreie Updates für Stata 14
Kostenfreie Updates für Stata 13
Kostenfreie Updates für Stata 12
Kostenfreie Updates für Stata 11

Bitte laden Sie die Stata-Executables und ado-Files für Ihr Betriebssystem herunter.

Stata Press

Stata Press - Stata's in-house Verlag - bietet Ihnen Fachbücher rund um Stata und verschiedene statistische Themen. Vom Anfänger bis zum erfahrenen Anwender, von Soziologie über Medizin bis zu Betriebs- und Finanzwirtschaft ist für jeden etwas dabei.

Auch die Stata Dokumentation und das vierteljährlich erscheinende Stata Journal werden von Stata Press heraus gegeben. Die beliebtesten Publikationen gibt es im praktischen eBook-Format.

Alle Stata Press Bücher und eBooks erhalten Sie bei uns im Online-Shop

Stata Einsteiger
Dieses Angebot richtet sich alle Neulinge und "blutigen Anfänger" in der quantitativen Datenanalyse.

Stata Könner
Effektives Arbeiten mit Stata und Einführung in die statistische Modellierung

Stata Profi
Mehrebenen-Modellierung, Längsschnittliche Modellierung van Paneldaten und Strukturgleichungsmodellierung

Stata NetCourses und Online-Tutorials

Stata NetCourses
Kostengünstige E-Learning-Kurse mit Themen rund um Stata, angeboten und durchgeführt von StataCorp LP.

Online-Tutorials
Videos und Playlists zu Analysen, Methoden und Einsatzbereichen von Stata auf Statas YouTube-Channel.

Sie wollen mehr erfahren?

Ihre Ansprechpartner

Ansprechpartner

Anzeigen

Schreiben Sie uns

Schreiben Sie uns an

sales@dpc-software.de

Rufen Sie uns an

Rufen Sie uns an

+49 (0) 212 / 260 66 0

Zum Onlineshop