Wednesday 28 June 2017

Nahes Zusammenführen In Stata Forex


Mast Therapeutics, um mit Savara Inc. (MSTX) zusammenzuarbeiten Mast Therapeutics Inc. (MSTX) verschmilzt mit privat gehaltenen Savara Inc. ein pharmazeutisches Unternehmen, das Therapien für seltene Atemwegserkrankungen entwickelt. Die San Diego, Kalifornien-basierte Mast hat drei vielversprechende Medikamente in fortgeschrittenen Stadien der klinischen Entwicklung: AeroVanc, Molgradex und AIR001, die erwartet werden, um eine gute Passform für Savaras Produktlinie zu machen. AeroVanc und Molgradex halten Orphan Drug Status, während Mast vor kurzem einen Pakt mit Royal Philips (PHG) für die AIR001 Medikament für Herz-Ausfall-Patienten mit Philips Adaptive Aerosol Delivery Vernebler verwendet werden. (Weitere Informationen finden Sie unter Mast Therapeutics, Philips Sign Drug Pact.) Neue Identität der zusammengetragenen Entität Die überlebende Entität wird als Savara Inc. bezeichnet. Es wird in Austin, Texas, gegründet und wird von Savaras gegenwärtigem Managementteam geführt. Der neue Firmenvorstand wird sieben Mitglieder haben, darunter fünf von Savaras aktuellen Bord und zwei von Masts aktuellen Board. Savara-Aktionäre werden rund 76 der kombinierten Einheit besitzen, während die Mast-Aktionäre die restlichen 24 besitzen werden. Die Fusion wird voraussichtlich im zweiten Quartal enden. Das neue Unternehmen wird an der NYSE mit einem neuen Tickersymbol gelistet. Um den Deal-Abschluss zu ermöglichen, muss Mast bestehende Aktionäre sichern, um einen umgekehrten Aktiensplit seiner ausstehenden Aktien auszuführen, um die Anforderungen der NYSE-Liste zu erfüllen. Near-Term Focus Die wichtigsten Meilensteine ​​in naher Zukunft für die kombinierte Einheit wird die Gründung einer Phase-3-Studie in Q3 2017 von AeroVanc zur Behandlung von chronischen Methicillin-resistenten Staphylococcus aureus pulmonalen Infektion bei Patienten mit zystischer Fibrose enthalten. Das zusammengeschlossene Unternehmen wartet auf die Ergebnisse einer laufenden europäischen und japanischen Phase-23-Studie von Molgradex zur Behandlung der pulmonalen Alveolar-Proteinose (PAP) und plant, die Ergebnisse (während Q1 2018) aus einer laufenden Phase-2-Studie von AIR001 für die Behandlung von zu verkünden Herzinsuffizienz mit erhaltener Ejektionsfraktion. Das Unternehmen wird auch versuchen, nicken von der US Food And Drug Administration (FDA) für die Durchführung einer wichtigen klinischen Studie von Molgradex während späteren Teil von 2017 zu sichern. Gegen Freitag schließt der Preis von 0,098 pro Aktie, die Mast Pharmaceuticals Marktkapitalisierung auf rund 24,05 Millionen bringt , Wurde das Unternehmen auf 36,5 Millionen für die Fusion mit mehr als 50 Prämien bewertet. Savara wurde auf 115 Millionen geschätzt, basierend auf der jüngsten Investitionsrunde und dem Erwerb von Vermögenswerten von Serendex Pharmaceuticals. (Weitere Informationen finden Sie unter Mast Therapeutics 3Q Loss Beats Street.) HINWEIS: Die IDRE Statistical Consulting Group wird die Website auf das WordPress CMS im Februar migrieren, um die Wartung und die Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht mehr gepflegt werden. Wir werden versuchen, Umleitungen zu pflegen, damit die alten URLs weiterhin so gut funktionieren wie möglich. Willkommen bei dem Institut für digitale Forschung und Bildung Hilfe der Stat Consulting Group, indem sie ein Geschenk Stata FAQ: Wie kann ich mehrere Dateien in Stata zusammenführen Diese FAQ basiert auf einer Seite, die von dem Graduate Statistical Assistant Program am Boston College entwickelt wurde. Wir sind dankbar für ihre Erlaubnis, diese FAQ hier zu reproduzieren. Es ist nicht ungewöhnlich, dass Daten, insbesondere Umfragedaten, in mehrere Datensätze kommen (es gibt praktische Gründe für die Verteilung von Datensätzen auf diese Weise). Wenn Daten in mehreren Dateien verteilt werden, werden die Variablen, die Sie verwenden möchten, oft über mehrere Datensätze verstreut. Um mit Informationen in zwei oder mehr Datendateien zu arbeiten, ist es notwendig, die Segmente in eine neue Datei zu verschmelzen, die alle Variablen enthält, mit denen Sie arbeiten möchten. Zuerst müssen Sie herausfinden, welche Variablen Sie benötigen und welche Datensätze sie enthalten, können Sie dies tun, indem Sie das Codebuch konsultieren. Neben dem Finden der Variablen, die Sie für Ihre Analyse möchten, müssen Sie den Namen der ID-Variable kennen. Eine id-Variable ist eine Variable, die für einen Fall (Beobachtung) im Dataset eindeutig ist. Für eine gegebene Person sollte die id über alle Datensätze gleich sein. Damit können Sie die Daten aus verschiedenen Datensätzen an die richtige Person anpassen. Für Querschnittsdaten ist dies typischerweise eine einzige Variable, in anderen Fällen werden zwei oder mehr Variablen benötigt, dies wird üblicherweise in Panel-Daten gesehen, wo Subjekt-ID und Datum oder Welle häufig benötigt werden, um eine Beobachtung eindeutig zu identifizieren. Damit Stata die Datasets zusammenführt, muss die ID-Variable oder Variablen denselben Namen über alle Dateien haben. Wenn die Variable eine Zeichenfolge in einem Datensatz ist, muss sie auch eine Zeichenfolge in allen anderen Datasets sein, und das gilt auch für numerische Variablen (der spezifische Speichertyp ist nicht wichtig, solange sie numerisch sind). Sobald Sie alle Variablen identifiziert haben, die Sie benötigen, und wissen, was die Variable (n) sind, können Sie beginnen, die Datasets zusammenzuführen. Ein einfaches Beispiel Ein guter erster Schritt ist, unsere Daten zu beschreiben. Wir können dies tun, ohne tatsächlich eine Datei zu öffnen (dies kann praktisch sein, wenn die Dateien sehr groß sind), alles was wir tun müssen, ist offen Stata und gibt den Befehl aus. Der beschreibende Befehl gibt uns viele nützliche Informationen, für unsere Zwecke die wichtigsten Dinge, die es zeigt, ist, dass die Variable id numerisch ist und dass die Daten unsortiert sind (die Daten müssen nach der Variablen Variablen oder Variablen sortiert werden, um zusammenzuführen ). Wir weisen auch darauf hin, dass die Variablen, die wir aus diesem Datensatz wünschen, tatsächlich im Datensatz sind. Wir möchten dies für alle drei unserer Datensätze tun, aber um Platz zu sparen, zeigen wir nur die Ausgabe für einen der Datensätze. Nehmen wir an, dass die Datensätze alle unsortiert sind und dass die id-Variable denselben Namen (id) in allen drei Datensätzen hat. Da die Datensätze arent sortiert sind, müssen wir jeden Datensatz öffnen, sortieren und dann den sortierten Datensatz speichern. Obwohl wir die Daten von einer Website leicht in Stata nutzen können, können wir sie dort nicht speichern. So beachten Sie, dass alle Gebrauchsbefehle Daten von unserer Website ziehen, aber speichern Sie sie in das Verzeichnis d: Daten auf dem Benutzercomputer. Die folgende Syntax öffnet jeden Datensatz, sortiert sie nach ID und speichert sie dann an einem neuen Ort mit einem neuen Namen. Wenn der Dataset bereits auf unserem Computer war, konnten wir ihn an der gleichen Stelle speichern und eventuell sogar unter dem gleichen Namen (den alten Datensatz ersetzen), das ist die Wahl der Benutzer. Als nächstes fusionieren wir tatsächlich die Datensätze. Der Merge-Befehl fügt entsprechende Beobachtungen aus dem aktuell im Speicher befindlichen Datensatz (genannt Master-Dataset) mit denen aus einem anderen Stata-Format-Dataset (sogenannte Dataset) in einzelne Beobachtungen ein. Angenommen, wir haben Daten3 offen vom Ausführen der obigen Syntax, das wird unser Master-Datensatz sein. Die erste Zeile der Syntax unten verbindet die Daten. Direkt nach dem Merge-Befehl ist der Name der Variablen (oder Variablen), die ID-Variablen dienen, in diesem Fall id. Als nächstes ist das Argument mit diesem sagt Stata, dass wir fertig sind, die ID-Variablen aufzumachen, und das, was folgt, sind die Datensätze, die zusammengeführt werden sollen. Die Namen sind aufgeführt, mit nur Leerzeichen (keine Kommas usw.) zwischen ihnen. (Beachten Sie, wenn die Namen oder Pfade Ihrer Datensätze Leerzeichen enthalten, müssen Sie sie in Anführungszeichen einschließen, d. h.). Die nächste Zeile der Syntax speichert unseren neuen zusammengeführten Datensatz. Beachten Sie, dass Merge keine Ausgabe erzeugt. Jetzt können wir uns einen neu zusammengeführten Datensatz ansehen. In der obigen Ausgabe sehen wir die Anzahl der Fälle (200), die richtig ist. Dies ist wichtig, da Probleme mit dem Zusammenführungsprozess oft zu wenig oder häufiger zu viele Fälle im zusammengeführten Datensatz führen. Wir sehen auch eine Liste der Variablen, die alle Variablen enthält, die wir wollen. Der zusammengeführte Datensatz enthält drei zusätzliche Variablen. Diese neuen Variablen sind zusammengeführt. Merge1 und merge2. Der Befehl merge erzeugt immer mindestens eine weitere Variable namens merge. Wenn mehrere Dateien bei der Verwendung angegeben sind. Der Befehl erzeugt zusätzliche Merge-Variablen, eine für jeden der Datensätze in der Verwendungsliste (in unserem Fall merge1 und merge2). Diese Variablen sagen uns, wo jede Beobachtung in der Datensatz kam, ist dies nützlich als eine Überprüfung, dass Ihre Daten ordnungsgemäß zusammengefasst. Manchmal ist eine Beobachtung nicht in einem gegebenen Datensatz vorhanden, das bedeutet nicht zwangsläufig, dass etwas in dem Zusammenführungsprozess schief gelaufen ist, aber das ist ein anderer Ort, an dem man oft Hinweise darauf bekommen kann, was im Zusammenführungsprozess falsch gegangen sein könnte. Denn in diesem Beispiel enthalten alle Datensätze alle Fälle, und weil der Zusammenschluss so ging, wie es sollte, sind die Zusammenführungsvariablen sehr interessant. Wir werden diese Variablen weiter unten näher erläutern, wenn wir mit Datensätzen umgehen, wo nicht alle Fälle in allen Datensätzen vorhanden sind. Löschen von unerwünschten Variablen Es ist nicht ungewöhnlich zu finden, dass ein großer Datensatz enthält viele Variablen, die Sie nicht in Ihrer Analyse verwenden werden. Sie können diese Variablen einfach in Ihre Datensätze verlassen, wenn Sie sie zusammen verschmelzen, aber es gibt mehrere Gründe, die Sie nicht möchten, dies zu tun. Zuerst gibt es eine Grenze für die Anzahl der Variablen, die Stata behandeln kann. In Small Stata ist die Grenze 99, in StataIC die Grenze ist 2.047 und in StataSE und StataMP die Grenze ist 32.767. Diese Grenzwerte können zwar hoch sein, aber wenn Sie mehrere Datensätze zusammenführen, jede mit einer großen Anzahl von Variablen, können Sie die Grenze für Ihre Art von Stata überschreiten. Der zweite Grund, warum du nicht unnötige Variablen in deinem Dataset verlassen möchtest, ist, dass jede Variable im Speicher zusätzliche Systemressourcen verwendet. Ein paar zusätzliche Variablen wird nicht etwas verletzen, aber wenn Sie eine große Anzahl von unerwünschten Variablen haben, können Sie Systemressourcen verschwenden. Im Folgenden zeigen wir verschiedene Methoden zur Beseitigung von zusätzlichen Variablen. Eine Option ist, dass, wenn Sie die Datasets öffnen, um sie zu sortieren, können Sie auch die Variablen beseitigen, die Sie nicht planen, zu verwenden. Je nachdem, ob es einfacher ist, die Variablen aufzulisten, die Sie in Ihrer Analyse verwenden möchten, oder um die Variablen aufzulisten, die Sie nicht benötigen, können Sie die Befehle verwenden oder fallen lassen. Es gibt mindestens eine zusätzliche Option, können Sie die Datasets nur die Variablen, die Sie benötigen im Speicher zu öffnen. Wenn ich einen Datensatz mit einer Anzahl von Variablen habe, aber die einzigen Variablen, die ich brauche, sind id und gelesen. Ich kann Variablennamen zu meinem Gebrauchsbefehl hinzufügen, wie in der ersten Zeile der Syntax unten gezeigt wird. Dies ist besonders nützlich bei sehr großen Dateien, die viel Speicher benötigen, um zu öffnen. Sobald Sie die gewünschte Teilmenge von Variablen geöffnet haben, müssen Sie nur die Untermenge von Daten unter einem neuen Namen speichern. Im obigen Beispiel enthielt dataset2 die folgenden Variablen: id, read, write, math, science and socst. Nehmen wir an, dass meine Analyse nur die Variablen lesen und schreiben muss. Die einzigen Variablen aus dataset2, die benötigt werden, sind die beiden und die Variable id, um die Daten mit einem anderen Dataset zusammenzuführen. Im Folgenden finden Sie Beispiele für die gleiche Art der Datenaufbereitung, die oben durchgeführt wurde, wobei jede der beschriebenen Techniken verwendet wurde. Diese Techniken sind äquivalent, da sie das gleiche Endergebnis erzeugen. Die Effizienz jeder Technik variiert je nach Situation. Verwenden von Keep, um Variablen auszuwählen: Verwenden von drop, um unerwünschte Variablen zu entfernen: Öffnen einer Teilmenge der Daten: Die Merge-Variablen Die Merge-Variablen, die durch den Merge-Befehl erstellt wurden, sind einfach zu verpassen, sind aber sehr wichtig. Wie oben diskutiert, erzählen sie uns, welche Datensätze jeder Fall kam. Dies ist wichtig, da viele Werte, die nur aus einem Datensatz stammen, ein Problem im Zusammenführungsprozess darstellen können. Allerdings ist es nicht ungewöhnlich für einige Fälle in einem Datensatz, aber nicht ein anderer. In Panel-Daten kann dies auftreten, wenn ein gegebener Befragter nicht an allen Wellen der Studie teilgenommen hat. Es kann auch aus einer Reihe von anderen Gründen auftreten. Zum Beispiel könnte ein weiblicher Befragter in der Teilmenge der Daten mit demographischen Informationen erscheinen, aber völlig fehlen aus der Teilmenge von Daten mit Informationen über weibliche Befragte Kinder, weil sie keine Kinder hat. Da Fälle, die nicht in allen Datensätzen vorhanden sind, nicht unbedingt ein Problem sind, damit die Informationen in Zusammenführungsvariablen nützlich sein können, müssen Sie wissen, was zu erwarten ist, wenn die Datensätze korrekt zusammengeführt wurden. Im obigen Beispiel, wo die gleichen 200 Fälle in drei Datensätzen erschienen, würde ich erwarten, 200 Fälle zu sehen, die alle von allen drei der Datensätze kamen. Wenn es irgendwelche Fälle fehlen, von einigen der Datensätze, dann würde ich erwarten, eine bestimmte Anzahl von Fällen zu sehen, die nicht aus allen Datasets kommen, aber ich muss immer noch dafür sorgen, dass es zu viele, die aus nur einigen der kommen Datasets Wenn Sie zu viele oder alle von den Fällen in Ihrem zusammengeführten Datensatz kommen, kommen Sie von einem oder nur wenige der Datensätze, die Sie zusammengeführt haben, ist ein Zeichen dafür, dass die ID-Variable nicht korrekt über Datensätze übereinstimmt. Dies ist besonders häufig, wenn die id-Variable eine Zeichenfolge ist. Im Folgenden untersuchen wir einen Datensatz nach der Verschmelzung, um zu sehen, ob alles wie erwartet gegangen ist. Die unten stehende Ausgabe zeigt die Datei für einen Datensatz data1m. dta, wenn wir uns die Anzahl der Beobachtungen anschauen (obs) sehen wir, dass der Datensatz nur 197 Fälle enthält, aber wir wissen, dass die Studie insgesamt 200 Fälle enthält, also wissen wir das dort Sind drei Fälle fehlen ganz aus data1m. Dies ist eine wichtige Information, wenn wir die Zusammenführungsvariablen später korrekt interpretieren werden. Schließlich sortieren wir die Daten und speichern sie unter einem neuen Namen. Um Platz zu sparen, werden wir nicht die Ausgabe für die beiden anderen Datensätze anzeigen (der Code erscheint unten, falls Sie es ausführen möchten). Nehmen wir an, dass wir, wenn wir auf data2m und data3m beschreiben, entdecken, dass sie auch fehlende Fälle sind. Dataset data2m enthält 196 Beobachtungen und dataset3m enthält 197. Es ist möglich, dass einige dieser Fälle aus allen drei Datensätzen fehlen (dh die fehlenden Beobachtungen überlappen sich über Datensätze), aber es ist auch möglich, dass alle 200 Beobachtungen in mindestens einer der Datasets Wir werden uns herausfinden, sobald wir die Daten zusammenführen. Sobald wir die Datensätze untersucht und sortiert haben, können wir sie zusammenführen. Die Syntax unten tut dies, beachten Sie, dass der Befehl der gleiche wie im ersten Beispiel ist. Standardmäßig erlaubt Stata, dass Fälle aus einem der drei Datensätze kommen. Es gibt Optionen, die es Ihnen erlauben, zu kontrollieren, welche Datensätze die Fälle kommen, können Sie herausfinden, über sie durch Tippen Hilfe Merge (ohne die Anführungszeichen) in Stata. Wie zuvor hat der Zusammenführungsbefehl drei neue Variablen zusammengeführt. Fusionieren Und merge2. Der Variable Merge gibt Auskunft darüber, welche Fälle im Master-Datensatz vorhanden sind, er nimmt einen von drei Werten an: Die Beobachtung ist nur im Master-Datensatz vorhanden

No comments:

Post a Comment