Erfolgsgeschichte

Wie maschinelles Lernen, simulierte Daten, AWS und Virtusa Innovation in die Diabetesforschung am IBRI brachten

Ein Katalysator für Innovationen, ein führendes biowissenschaftliches Forschungsinstitut im Mittleren Westen, das Indiana Bioscience Research Institute (IBRI), arbeitet an seiner Mission, das erste von der Industrie inspirierte Institut bei der Entwicklung von Lösungen zu werden, die die Gesundheit von Menschen verbessern, die an Diabetes, Stoffwechselkrankheiten und schlechter Ernährung leiden. Amazon Web Services (AWS) und Virtusa wurden von Cardinal Health zur Unterstützung des IBRI und von Fuse hinzugezogen, um die technischen Fähigkeiten und die Infrastruktur für die Bewertung und Optimierung eines simulierten elektronischen Gesundheitsdatensatzes (EHR) von Fuse bereitzustellen, damit er den Merkmalen der EHR-Datensätze des IBRI in Bezug auf Typ-2-Diabetes (T2D) entspricht.

Das IBRI nutzt diese EHR-Datensätze zusammen mit seinen Forschungskollegen, um Erkenntnisse über Patientenuntergruppen, Krankheitsmerkmale und Komplikationen von Patienten mit T2D zu gewinnen und T2D-bezogene Vorhersagemodelle zu entwickeln und zu validieren. Eine verbesserte Datenanalyseplattform und ein "realistischer" simulierter Datensatz, der der Komplexität eines echten EHR-Datensatzes entspricht, wie er von Fuse bereitgestellt wird, hat das Potenzial, bestimmte Forschungsaktivitäten des IBRI zu beschleunigen.

 

 

Die Herausforderung

Das Institut nutzt EHR-Datensätze, die im Rahmen entsprechender Datennutzungsvereinbarungen zur Verfügung gestellt werden, um seine Forschung voranzutreiben. Doch obwohl diese Daten anonymisiert sind, unterliegen sie bestimmten Nutzungsbeschränkungen sowie internen Verzerrungen. Das sind die Herausforderungen:

  • Die Daten der elektronischen Patientenakten werden derzeit auf gesicherten Computern bereinigt und verarbeitet, die für Wissenschaftler nur schwer zugänglich sind.
  • Es wurde zu viel Zeit für die Entwicklung, die Profilerstellung und das Testen von Datensätzen aufgewendet.
  • Die Datenbankarchitektur zur Unterstützung und zum regelmäßigen Zugriff auf große Datenmengen war begrenzt.
  • Es stehen keine alternativen Datenquellen (z. B. simulierte EHR-Daten) zur Verfügung, um bestimmte geeignete Forschungsaktivitäten durchzuführen.
Die Lösung

Die von AWS betriebene vLife-Plattform von Virtusa und der Zugriff auf und die Optimierung von simulierten Daten, die auf dieser Plattform gespeichert sind, halfen dem IBRI, sichere und kollaborative Analysefunktionen zu testen, um Forschung und Innovation zu beschleunigen:

  • Dashboards: Interaktive Dashboards liefern in Echtzeit aggregierte Erkenntnisse aus Profildaten und bieten Diagramm- und Self-Service-Visualisierungen.
  • Erstellung von Modellen für maschinelles Lernen (ML): Schneller Zugriff und Umwandlung eines Merkmals, um maschinelles Lernen zu ermöglichen und die Genauigkeit von Modellen in verschiedenen Datensätzen zu testen, ist möglich.
  • Synthetischer Datensee: Riesige Datenmengen werden gespeichert und schnell abgerufen, da vorgefertigte Datenbankansichten unterstützt werden, die sofort abgefragt werden können.
  • Laden von Daten und Qualitätskontrolle: Die in den Data Lake eingebrachten Dateien werden automatisch in die Datenbank geladen, und die Metriken zur Qualitätskontrolle werden automatisch erstellt.
  • Generator für simulierte Daten: Simulierte Daten können iterativ verbessert werden, um die Eigenschaften der realen EHR-Datensätze anzugleichen, und maschinelles Lernen wird verwendet, um tiefe Korrelationen (z. B. Komplikationen oder klinische Variablen) innerhalb der "realen" gegenüber "simulierten" Daten zu testen.

Verwendete AWS-Dienste

  • Amazon EC2
  • Amazon SageMaker
  • Amazon S3
  • Amazonas-Athena
  • Amazon CloudFront
  • Amazon Redshift
  • Amazon RDS
  • Amazonas ELB
Die Lösung
Der Nutzen

Forscher am IBRI haben jetzt Zugang zu einer AWS-basierten Plattform und einem simulierten, für Diabetes optimierten EHR-Datensatz, der Deep-Computer-Learning-Technologien nutzt, um die Forschung im Zusammenhang mit der Mission des IBRI zu beschleunigen.

  • AWS Cloud schafft eine einzige Wahrheitsquelle für alle Daten und ermöglicht Forschern den Zugriff auf Echtzeitdaten, um schneller bessere Entscheidungen zu treffen.
  • Das maschinelle Lernen automatisiert die mühsame Arbeit des Data Engineering, der Profilerstellung und des Testens, so dass sich die Forscher auf die Entdeckung neuer und innovativer Lösungen konzentrieren können.
  • Die realistisch simulierten EHR-Daten bieten ein alternatives Instrument für die Forschungszusammenarbeit mit zahlreichen Vorteilen, die in den unten aufgeführten Referenzen aufgeführt sind.

 

Referenzen

Artikel: Die neue Synthetik

Artikel: Die Macht simulierter Daten zur Beschleunigung der Forschung nutzen

Über das IBRI

Das Indiana Biosciences Research Institute (IBRI) ist ein 2013 gegründetes gemeinnütziges, unabhängiges Institut für angewandte Forschung mit Sitz in Indianapolis. Das IBRI bringt Unternehmen und Universitäten zusammen, um gemeinsam an miteinander verknüpften Gesundheitsthemen zu arbeiten, die sowohl von globaler Bedeutung sind als auch unverhältnismäßig starke Auswirkungen auf die Einwohner von Indiana haben - Diabetes, Stoffwechselkrankheiten und schlechte Ernährung sowie die damit verbundene Gesundheitsdatenwissenschaft und -analytik. Unser Motto lautet Discovery With Purpose und spiegelt unser Engagement für die Umsetzung wissenschaftlicher Erkenntnisse in verbesserte Ergebnisse für Patienten wider. http://indianabiosciences.org

Eine Innovationsplattform für Biowissenschaften

Erfahren Sie, wie Sie von der offenen Innovationsplattform vLife profitieren können

Verwandte Inhalte