KI mit Big vs. Small Data: Google DermAssist und mehr
- Titus Kaletta
- 22. Mai
- 5 Min. Lesezeit

Braucht es wirklich Riesendatensätze, um KI in der Dermatologie sinnvoll einzusetzen? Oder reicht auch eine kleinere, präzise gewählte Datenbasis – mit robuster Aussagekraft und klarem Fokus? Ein mittelständisches Life-Science-Unternehmen aus Deutschland zeigt, dass KI-Lösungen auch fernab von Silicon Valleys DermAssist-App möglich sind. Erfahren Sie, warum mehr nicht immer besser sein muss und entdecken Sie inspirierende Beispiele, die zum Umdenken anregen.
Zusammenfassung
|
Inhaltsverzeichnis
Ein dunkler Fleck auf dem Unterarm wirft Fragen auf. Handelt es sich um ein harmloses Muttermal – oder steckt mehr dahinter? Die Bilder und Warnungen aus den Aufklärungsbroschüren kommen einem sofort in den Sinn. Einen zeitnahen Termin beim Hautarzt zu bekommen, ist aber nahezu unmöglich.
Um dennoch Gewissheit zu erlangen, wird kurzerhand das Handy gezückt: App öffnen, Fotos machen, ein paar Fragen beantworten. Sekunden später liefert die Anwendung erste Einschätzungen – inklusive Empfehlung, ob ein Arztbesuch notwendig ist.
Was vor wenigen Jahren noch nach Zukunftsmusik klang, ist heute Realität. Zum Beispiel mit Googles Anwendung DermAssist.

1. DermAssist: Hautdiagnose im Big-Data-Modus
Schon in einem früheren Beitrag haben wir über Googles faszinierende App DermAssist berichtet (hier mehr erfahren); nun möchten wir sie im Rahmen unseres neuen Artikels zu "Big Data vs. Small Data" erneut in den Fokus rücken. Zur kurzen Erinnerung:
DermAssist zählt zu den bekanntesten KI-basierten Systemen im Bereich der Dermatologie. Die App – bzw. Webanwendung – analysiert Hautveränderungen anhand von drei Fotos und einigen Symptombeschreibungen. Laut Angaben von Google erkennt der zugrundeliegende Algorithmus 288 verschiedene Hauterkrankungen. Dabei berücksichtigt er unterschiedliche Hauttypen und Altersgruppen.
Die Anwendung erreicht eine diagnostische Genauigkeit von rund 90 % – vergleichbar mit erfahrenen Dermatolog:innen, so eine Studie in Nature Medicine. Dahinter steckt jedoch ein tiefes neuronales Netz, trainiert mit über 65.000 klinischen Hautbildern und mehreren Millionen zusätzlicher Referenzdaten.
Ein beachtlicher technischer Aufwand, der zweifellos seine Berechtigung hat. Aber: Müssen KI-Systeme immer gleich mit derartigem Datenvolumen ausgestattet sein? Erfahren Sie im nächsten Abschnitt, ob es nicht doch die eine oder andere KI-Dermatologie Lösung gibt, die aus der datenhungrigen Mehrheit heraussticht.
2. Weitere KI-basierte Dermatologie-Tools
In einer Übersichtstabelle haben wir verschiedene Anwendungen aus Europa und den USA für Sie aufgelistet: Wo kommen sie zum Einsatz? Welche Modelle werden genutzt? Und was ist das besondere an diesen Anwendungen? Hier ein kurzer Überblick:
Produktname & Unternehmen | Einsatzgebiet | Praktische Anwendung & Anwender | KI-Modell | Zulassung | Besonderheit |
DermaSensor (DermaSensor Inc., USA, 2011) | Nicht-invasive Risikobewertung von Hautläsionen in der Primärversorgung | Optische Spektroskopie, Risikowert Hausärzte | Mischung Spektroskopie + ML/NN | FDA-Clearance, CE (EU), Australien,Neuseeland | Erstes KI-Spektroskopiegerät mit FDA-Zulassung |
MoleanalyzerPro(FotoFinder Systems, DE, 2015) | Unterstützung bei der Beurteilung von Hautläsionen mittels Dermatoskopie | Dermatoskopieaufnahmen, Risikoscore, Total Body Mapping Dermatologen | Deep Learning, CNN | CE-zertifiziert (EU) | Zweitmeinungsservice, tiefe Praxisintegration |
SkinVision (SkinVision B.V., NL, 2012) | Früherkennung von Hautkrebs durch App-basierte Risikobewertung | Fotos per App, Risikoanalyse „niedrig/erhöht/hoch“ Endverbraucher | Deep Learning, CNN | CE-zertifiziert (EU), TGA (Australien) | Einer der ersten Pioniere, hohe Sensitivität (~95 %) |
DermEngine (MetaOptima Technology Inc., Kanada, 2012) | Analyse und Verwaltung von Hautläsionen zur Unterstützung der Hautkrebsdiagnostik | Cloud-Plattform für Hautbildanalyse, Total Body Photography, Teledermatologie Dermatologen, Kliniken | Deep Learning + klassisches ML | CE-zertifiziert (EU), HIPAA-, GDPR-konform | Kombination aus komplexem Deep Learning (Visual Search) und einfachen regelbasierten Entscheidungsbäumen (Anamneseanalyse) |
PsorX (Dermagnostix GmbH, DE, 2020) | Differenzierung zwischen Psoriasis und Ekzemen durch molekulare Markeranalyse | PCR-Test, molekulardiagnostische Genmarkeranalyse (NOS2, CCL27) Labor, Klinik | Klassisches ML (logistische Regression) | CE-zertifiziert (EU) | Einfaches, extrem präzises Modell (~97 %) mit sehr geringen Datenmengen |
DermAssist (Google Health, USA, 2021) | Unterstützung bei der Selbstdiagnose von Hauterkrankungen | Fotos per App/Web, Symptomeingabe, Diagnosevorschläge zu 288 Erkrankungen Endverbraucher | Deep Learning, CNN | CE-zertifiziert (EU), keine FDA | Breites Diagnose-Spektrum (fast 300 Hauterkrankungen), für internationale Anwendbarkeit prädestiniert |
Ein Beispiel aus der Tabelle oben sticht besonders hervor – nicht durch Datenmasse, sondern durch einen gezielten, molekulardiagnostischen Ansatz: PsorX-LabDisk von Dermagnostix. Erfahren Sie im nächsten Abschnitt mehr darüber.
3. PsorX-LabDisk: Datensparsame Alternative
Dermagnostix, ein mittelständisches Life-Science-Unternehmen aus Deutschland, setzt mit PsorX-LabDisk auf einen datensparenden und zugleich hochpräzisen Ansatz zur Unterscheidung zweier Erkrankungen, die sich klinisch ähnlich präsentieren, Ekzem gegenüber Psoriasis (Schuppenflechte), aber unterschiedlich therapiert werden müssen.
Hier das Diagnoseverfahren mithilfe der PsorX-LabDisk von Dermagnostix im Detail:
Ein Patient kommt mit einer unklaren Hautveränderung. Die klinische Untersuchung ergibt kein eindeutiges Bild. Eine Biopsie wird entnommen – vier Millimeter groß, nicht mehr als ein Stecknadelkopf. In einem Labor oder einer Klinik wird diese Probe anschließend auf eine handtellergroße Disk aufgebracht und in ein Analysegerät eingelegt.
Dort läuft alles automatisiert: RNA-Extraktion, Analyse zweier Genmarker (NOS2 – typischerweise hoch bei Psoriasis und CCL27 – typischerweise hoch bei Ekzem), Auswertung per quantitativer RT-PCR. Die anschließende Bewertung übernimmt ein KI-Modell auf Basis einer L2-regularisierten logistischen Regression.
Das Ergebnis: Nach 45 Minuten bis zwei Stunden liegt eine differenzierte Diagnose vor, die eine gezielte Therapieentscheidung ermöglicht.

Trainiert wurde das System mit Daten von rund 130 Patienten, validiert an weiteren 107 Proben. Das Resultat: >95 % Sensitivität, 100 % Spezifität. Der Clou: Es werden nur zwei Gene analysiert. Keine riesigen Bildarchive, keine tiefen neuronalen Netze, keine Black Box. Dafür ein transparentes, auditierbares System – CE-zertifiziert, klinisch validiert, medizinisch nachvollziehbar. Erfahren Sie mehr zu dem Produkt hier.
Betrachten wir im darauffolgenden Abschnitt die zwei verschiedenen KI-Ansätze genauer.
4. Klassisch linear vs. neuronal komplex
In der Tech-Welt gilt oft: Je komplexer das System, desto besser. In der medizinischen Praxis sieht das anders aus. Hier zählt nicht nur, was ein Modell leisten kann – sondern auch, ob man versteht, wie es zu seinen Entscheidungen kommt.
Erklärbarkeit vor Komplexität vs. Hochleistung vor Transparenz – nachfolgend ein Blick unter die "technische Motorhaube" der verschiedenen Modelle:
4.1 Klassische lineare Verfahren: Erklärbarkeit vor Komplexität
Logistische Regression: Liefert Wahrscheinlichkeiten für bestimmte Diagnosen. Robust, transparent und gut interpretierbar – besonders wenn nur wenige, aber aussagekräftige Variablen vorliegen – wie im Fall von PsorX-LabDisk.
Entscheidungsbäume: Arbeiten regelbasiert nach einem „Ja-Nein“-Prinzip, die entlang mehrerer Entscheidungsgabelungen zu einer endgültigen Entscheidung führen. Leicht nachvollziehbar und visuell darstellbar (Baum mit sich verzweigenden Ästen).
Um zu vermeiden, dass ein bestimmtes Merkmal (z. B. ein Genmarker) zu stark gewichtet wird (Risiko einer Überanpassung), kann ein Random-Forest-Modell, genutzt werden. Dieses Modell verwendet sehr viele Entscheidungsbäume, denn es gilt: „Ein einzelner Baum kann sich irren – ein Wald liegt selten daneben.“
Beispiel: DermEngine von MetaOptima nutzt regelbasierte Entscheidungsbäume in der dermatologischen Anamneseanalyse und Risikobewertung – etwa als Entscheidungshilfe für Dermatolog:innen bei der Frage, ob ein Patient zur spezifischeren Behandlung überwiesen oder weiter beobachtet werden sollte.
4.2 Neuronale Netze – Hochleistung vor Transparenz
Convolutional Neural Networks (CNN): Unverzichtbar für bildbasierte Diagnostik (siehe DermAssist). Erkennen Muster auf mehreren Ebenen – von einfachen Strukturen bis zu komplexen Merkmalen.
Funktionsweise ist jedoch i.d.R. schwer nachvollziehbar und undurchsichtig (siehe Black-Box-Charakter). Für Ärztinnen und Ärzte, die Verantwortung für eine Diagnose tragen, ist das nicht immer hilfreich.
Hier nochmal alle Vor- und Nachteile beider KI-Modelle gegenübergestellt:
Klassisches Machine Learning (z.B. PsorX-LabDisk) | Komplexes neuronales Netzwerk (z.B. DermAssist) |
Weniger Daten nötig | Benötigt riesige Datensätze |
Hohe Transparenz, leicht erklärbar | Undurchsichtig, schwer nachvollziehbar |
Weniger rechenintensiv | Hohe Rechenleistung erforderlich |
Ideal für gezielte Marker-Analysen | Ideal für komplexe Bildanalysen |
Zusammenfassend lässt sich sagen, dass DermAssist und PsorX-LabDisk exemplarisch für zwei unterschiedliche Wege der medizinischen KI-Entwicklung stehen. Der eine setzt auf allgemeine Breite, Bilddaten und neuronale Netze. Der andere auf spezialisierte Tiefe, molekulare Marker – und ein erklärbares Modell. Welche Implikationen sich daraus für kleine und mittlere Unternehmen aus der Life-Science-Branche ergeben, erfahren Sie nachfolgend.
5. Was bedeutet das letztlich für Life-Science-KMU?
Für kleine und mittlere Unternehmen im Gesundheitsbereich ergibt sich ein interessantes Spannungsfeld:
Auf der einen Seite stehen datenintensive Systeme (z.B. DermAssist) mit breitem Anwendungsspektrum – technisch faszinierend, aber auch regulatorisch und infrastrukturell anspruchsvoll. Auf der anderen Seite stehen spezialisierte, schlanke Modelle (z.B. PsorX-LabDisk) mit klar umrissener Zielsetzung – oft schneller in der Umsetzung, leichter zu auditieren und näher an der medizinischen Praxis.
Beide Ansätze haben ihre Berechtigung. Entscheidend ist, das passende Modell für die eigene Fragestellung zu finden (z.B.: Kann ich mich mit einer App schnell selbst diagnostizieren? Soll der Patient überwiesen oder weiter beobachtet werden? Handelt es sich um Psoriasis oder ein Ekzem?) – und nicht dem nächstgrößeren Datensatz hinterherzulaufen.
Nicht die Datenmenge ist entscheidend (wieviel) – sondern das damit zu erreichende Ziel (wozu). Benötigt werden nur so viele Daten, wie es die Fragestellung erfordert.
Auch auf die Rahmenbedingungen und die verfügbaren Ressourcen kommt es an. Der „Small-Data-Ansatz“ bietet dabei insbesondere mittelständischen Unternehmen eine interessante Perspektive. Der Fokus auf erklärbare, gezielte Modelle kann zudem regulatorische Hürden senken und die Zusammenarbeit mit klinischen Partnern erleichtern. Denn dort, wo Verantwortung getragen wird, kann Vertrauen in die Entscheidungswege am Ende ausschlaggebend sein.
Möchten Sie mehr über die Auswahl passender KI-Modelle für medizinische Anwendungen erfahren – oder diskutieren, was für Ihre Situation sinnvoll sein könnte? Wir freuen uns über den Austausch. Verpassen Sie außerdem nicht unsere nächste Veröffentlichung, die wie immer donnerstags und diesmal am 19. Juni erscheint.
Quellen:
Foto 1 (abgeändert) von Geralt und Anne Kroiss (Pixabay)
Foto 2 erstellt mithilfe von KI in Anlehnung an ein Originalbild von Google Health
Foto 3 erstellt mithilfe von KI in Anlehnung an ein Originalbild von Diagnostix
Disclaimer: Alle Angaben erfolgen nach bestem Wissen und Gewissen, jedoch ohne Gewähr für Vollständigkeit, Richtigkeit und Aktualität.
Das könnte Sie auch interessieren:

Comments