Data Science

  • Datenwissenschaftler verlassen sich auf Stata dank seiner ausgeprägten Funktionalitäten im Bereich Programmierung, Reproduzierbarkeit, Erweiterbarkeit und Interoperabilität. Vom data wrangling bis zum Reporting liefert Stata Ihnen die Tools, die Sie zur erfolgreichen Analyse benötigen. Ein liberales Lizenzmodell ermöglicht Ihnen Stata in Ihren eigenen proprietären Workflow zu integrieren.

    Features für Data Science

    • Data wrangling
      Scrapen Sie Daten aus dem Web, importieren Sie sie aus typischen Formaten, oder importieren Sie sie via ODBC und SQL. Mergen Sie Datensätze, fügen Sie Beobachtungen an, restrukturieren, transponieren, sortieren und filtern Sie mühelos Ihre Daten. Stata bewältigt Unicode, BLOBs, reguläre Ausdrücke, und mehr. Egal ob sie mit hunderttausenden oder sogar Milliarden von Datenpunkten arbeiten.
    • Erzeugung dynamischer Dokumente
      Nutzen Sie Markdown um HTML Dokumente mit eingebettetem Stata Code, Output oder Grafiken zu erstellen. Automatisieren Sie Word-, PDF- oder Excel-Berichte mit high-level Export-Möglichkeiten und low-level, feinkörnigem programmatischen Zugriff. So vereinfachen Sie skalierbar und effektiv die Erstellung der Dokumente, die Ihr Team braucht.
    • Visualisierung
      Erzeugen Sie Grafiken und passen Sie diese programmgesteuert oder mit dem Graph Editor interaktiv an. Änderungen können sogar aufgezeichnet und später zur einfachen Reproduzierbarkeit auf andere Grafiken angewendet werden. Exportieren Sie Ihre fertigen Grafiken in Standardformate für Web (SVG, PNG) oder Druck (PDF, EPS, PS).
    • Programmierung
      Automatisieren Sie Ihren gesamten Workflow sowohl mit Skripten als auch mit kompletten Programmiersprachen-Funktionalitäten wie Klassen, Strukturen und Pointer. Ein einzigartiges Feature in Statas Programmierumgebung ist Mata; eine schnelle und kompilierte Matrix-Programmiersprache.
    • Interoperabilität
      Binden Sie externen Code über Java- und C++-Plug-Ins ein. Steuern Sie Stata via OLE-Automation oder führen Sie es im Batch-Modus aus. Schreiben Sie benutzerdefinierte SQL-Statements um Datenbanken zu extrahieren oder zu populieren.
    • Statistik und Modellierung
      Nutzen Sie state-of-the-art statistische Modelle und Ergebnisse für Ihren Workflow. Identifizieren Sie Gruppen in Ihren Daten mittels unsupervised Techniken wie Cluster-, Hauptkomponenten- und Faktoranalyse, multidimensionale Skalierung oder Korrespondenzanalyse. Begreifen Sie Ihre Gruppen noch besser durch Latent Class Analysis. Wenn Ihre Analyse supervised Techniken erfordern, bietet Stata Ihnen flexible nicht-parametrische Methoden sowie vielfältige Regressionsverfahren von linearen und logistischen bis hin zu Mixture-Modellen.
    • Reproduzierbarkeit
      Stata ist das einzige Softwarepaket für Data Science mit einer stringenten Versionskontrolle. Damit ist sichergestellt, dass Ihr Code auch weiterhin ohne jegliche Modifikation ausführbar bleibt. Auch nachdem Updates oder neue Versionen released werden. Befreien Sie sich von mehrfachen Legacy-Installationen nur damit Ihr System nicht zusammenbricht; Stata Code von vor 25 Jahren kann immer noch unverändert ausgeführt werden. Datensätze, Grafiken, Skripte, Programme und mehr sind zu 100 % cross-platform- und abwärtskompatibel.

Kontakt

Ihre Fragen schicken Sie bitte an:

E-Mail: info@dpc-software.de

Fax: +49 (0)212 / 26066-66