Dieses Blogpost ist ein kleines Experiment, aber wir sind immer noch im Bereich der künstlichen Intelligenz bzw Machine Learning aka maschinelles lernen. Neben meiner Tätigkeit als Data Scientist beschäftigte ich mich leidenschaftliche gerne mit dem Thema Aktien. Aktien mit Kopf bzw. Koljas Videos gucke ich mir ab und zu gerne an. Letzte Woche hat er die voraussichtliche IPO (Inital Public Offering) der Firma C3.ai  in diesem Video angesprochen. Da wurde ich hellhörig und gespannt, was das für eine Firma ist und welche Produkte diese anbietet. Waren Buffet hat einmal gesagt "Investiere nur in eine Aktie, deren Geschäft du auch verstehst". Um das Geschäft von C3AI zu verstehen, müssen wir uns die angebotenen Produkte angucken. Wie schafft es C3AI künstliche Intelligenz als Produkt anzubieten und warum sollte die Kunden nicht zur Konkurrenz gehen?

Diese Fragen möchte ich dir heute erläutern. Wichtig ist, ich gebe dir hier keine Investionstipps. Ich versuche dir möglichst simple die Produkte von C3.ai zu erklären.

Was sind die Produkte?

C3 AI Integrated Development Studio

Es ist eine Entwicklungsumgebung die reichlich durchdachte Features beinhaltet. Sie vereint mehrere Module wie zum Beispiel: das Sammeln von Daten, Entwickeln von Machine Learning-Modellen, Auswertung der Modell-Performance und bauen eines Interfaces für die KI. Es werden hier viele Arbeitsschritte eines Data Scientist automatisiert, um die schwierige Arbeit mit vielen Daten, auch Big Data genannt, zu erleichtern. Dazu bietet C3AI einsteigerfreundliche Werkzeuge an, die nicht viel Wissen über Programmierung benötigt. Damit soll die Programmier-Arbeit verringert werden und es können auch nicht spezialisierte Data Scientists, diese Werkzeuge nutzen. Das C3 AI Integrated Development Studio ist in mehrere Module unterteilt:

  1. Das erste Werkzeug ist C3 AI Data Studio: Hier werden Daten reingeladen und das Tool kann diese Daten visualisieren, um jetzt schon Muster, Strukturen oder Fehler in den Daten zu erkennen. Die Daten können entweder lokal hochgeladen bzw. aus der Cloud der bekannten Anbieter angebunden werden. (AWS) Es ist eine Automatisierung täglicher Arbeitsschritte eines Data Scientist
  2. C3 AI ML Studio: Modul, um Machine Learning-Modelle zu entwickeln. Hier gibt es vorgefertigte "State of the Art"-Modelle. Jedoch können eigene Modelle entwickelt werden mit verschiedenen Third-Party-Frameworks wie Tensorflow, Pytorch und viele mehr. Nach der Erstellung des Modells können hier verschiedene weitere Funktionalitäten genutzt werden, wie zum Beispiel:

    - AutoML: Nach Erstellung des Modell gibt es noch eine weitere Schwierigkeit.  Die Hyperparameter eines Machine-Learning Modells. Was meine ich damit. Ein Modell muss eine bestimmte Zeit trainiert werden. Diese Zeit wird in Epochen unterteilt. Das wäre schonmal ein Hyperparameter. In einer Epoche gibt es X-Lernschritte. Wie viele Daten in einem Lernschritt verarbeitet werden ist ein weiterer Parameter. Zudem gibt es eine Lernrate. Diese bestimmt, wie groß der Schritt ist der Anpassungen des Lernens. Lernen wir zu schnell, dann bleibt nichts hängen. Lernen wir zu langsam, kostet das viel Geld. Warum? Ich sag nur Serverkosten.

    Ich visualisiere euch das mal hier kurz. Beim Lernen, wollen wir an das Minimum dieser Parabel. Ich kann mich nun langsam dem Minimum annähern oder mit großen Schritten. Was die optimale Lernrate ist, um möglichst wenig Schritte zu machen und ohne das Minimum zu überspringen, muss ein Data Scientist durch testen herausfinden. Zusätzlich gibt es gibt noch viele weitere Hyperparameter, aber nur die richtige Kombinationen aus diesen Hyperparametern liefert und ein qualitatives Modell, welches gut "gelernt" hat und wenig falsche Ergebnisse liefert. AutoML ist eine sehr nützliche Methode, um sich automatisiert an die beste Kombination aller Hyperparameter anzunähern.

    - Visueller Vergleich verschiedener Modelle: Da viele Modelle mit vielen verschiedenen Hyperparametern-Kombinationen verglichen werden müssen, hat C3AI auch hier ein extra Tool bereitgestellt, welches diesen Arbeitsschritt auch automatisiert.

    - Überwachung der operativer also eingesetzter Modelle: Daten können sich mit der Zeit leicht ändern und die Qualität der Vorhersagen des Modells leiden darunter. Dafür gibt es eine Art Überwachung, um bei solchen Problem eingreifen zu können.
  3. C3 AI Application Studio: Hier gibt es die Möglichkeit zur Entwicklung eines Frontends, um die KI als Mensch zu benutzen. Die Ergebnisse müssen möglichst einfach aufbereitet werden, sodass die "KI" eine gute Entscheidungshilfe oder ein guter "Mitarbeiter" wird. Ohne diese Visualisierung bringt einem die beste KI nichts.
  4. C3 AI DevSecOps Studio: Release-Tool, um neue Version zu veröffentlichen. In der Softwarebranche gibt es immer wieder Schwierigkeiten, wenn neue Versionen erscheinen. C3AI will es Benutzer/Entwickler einfacher machen Modelle oder neue Versionen des User Interface zu veröffentlich bzw. in Produktion zu schicken.
  5. C3 AI Marketplace: Entwickler können hier (wahrscheinlich) ihre Datenprodukte / Machine-Learning-Modelle für die Kunden von C3AI anbieten und monetarisieren.
  6. Third Party IDEs: Integration der C3 AI Integrated Development Studio Tools in Visual Studio Code (was ich selbst auch nutze). Es gibt keinen Zwang das Development Studio nur im Browser zu benutzen.

Zusammenfassung C3 AI Integrated Development Studio
Es sind alles sehr nützliche Werkzeuge, die ein hohes Maß an Automatisierung aufweisen. Arbeitsschritte benötigen weniger Arbeitszeit und es kann sich mehr auf die Qualität der Modelle fokussiert werden, um folglich ein sehr gutes Ergebnis zu erhalten. Meiner Meinung ist das ganze gut durchdacht und als Entwickler würde ich mich sehr über solche Werkzeuge freuen. Da ich selbst keine Erfahrungen machen konnte, weil es zur Zeit eine Warteschlange gibt, um diese zu testen, kann ich keinerlei Aussage über die Wahrheit dieser Versprechungen machen.

C3 AI Ex Machina

Das erste Produkt ist das Fundament für alle weiteren Produkte von C3AI. Ex Machina soll nun entweder vom Business Analyst oder vom End-User verwendet werden, um die einzelnen Bausteinen zu einem Workflow oder Pipeline zusammenzustecken ohne Programmierkenntnisse.

Ex Machine für Business Analyst

Da ich selbst mich auf der Warteliste befinde, kann ich nicht den ganzen Umfang dieses Produkts erklären. Auf der Seite gibt es jedoch ein kleines Video, welches an einem Anwendungsbeispiel zeigt, wie jemand die "Churn-Rate" also die Rate an nicht wiederkehrenden Kunden, aus einer CSV-Datei ermittelt. Diese Datei beinhaltet Kundendaten und diese werden erstmal in das richtige Format gebracht. Zeilen, die Ja oder Nein enthalten werden in Einsen oder Nullen umgewandelt. Strings, die eigentlich Zahlen sind, werden in Integer umgewandelt.

Diese ganze Umwandlung passiert grafisch. Die Operationen sind Knoten und diese werden miteinander verbunden in einer gewissen Reihenfolge. Wichtig dabei zu erwähnen ist, dass keine Zeile Code geschrieben werden muss. Im nächsten Schritt werden diese Daten in Test und Trainingsdaten aufgeteilt. Dieses Vorgehen ist ein Vorbereitungsschritt, um Machine-Learning-Modelle zu trainieren. Wir haben einen Trainingssatz, aus dem das Modell einen Wissenstand aufbauen kann. An dem Testdatensatz wird dann das Modell getestet.


Der Algorithmus wird auf "magische Weise" in diesem Video trainiert und wird anschließend angewendet auf den Testdatensatz. Die Churn-Rate wurde berechnet. Um diese Metrik nun sinnvoll zu nutzen wird die Rate mit dem Gewinn jedes Kunden multipliziert. Daraus ergibt sich, wie viel Gewinn wegfallen würden, wenn dieser Kunde dem Unternehmen verloren geht. Das Ergebnis wird nun sortiert nach: Kunden, die am meisten Gewinn einbringen, aber auch der Kippe stehen zu einem Kompetitor zu wechseln oder nicht mehr wiederzukommen. Die TOP 5 dieser Kunden könnten nun Kontaktiert werden, um dafür zu sorgen, dass sie nicht dem Unternehmen verloren gehen. Dieser Prozess an Schritten zeigt, wie man aus Daten eine Erkenntnis gewonnen hat und diese nun operationell umsetzen kann.
Ich wiederhole mich, aber in dieser Demonstration wurde keine Zeile Code geschrieben. Natürlich stellen sie ihre Produkt nicht in ein schlechtes Licht, aber es ist sehr beeindruckend zu sehen, wie weit C3AI, die Arbeitsschritte eines Data Scientist automatisiert habt. Ich würde mich jetzt aber auch zu weit aus dem Fenster lehnen, wenn ich sagen würde, dass jeder das Produkt benutzt kann. Aber die Dauer die benötigt wird, um so eine Auswertung zu erstellen sinkt dramatisch. Das sehen wir auch noch später.

Negativ-Punkt: Was sind die Limitierungen des Produktes? Von der Aufmachung erscheint es erstmal alles sehr simple und darin liegt manchmal die Crux. Leider konnte ich das Produkt zum jetzigen Zeitpunkt nicht selbst testen, aber wenn ich einen Zugang zur kostenlosen Version bekomme, werde ich darüber eine Art Review machen.

Preis des Produkts

Das coole ist bei diesem Produkt, dass es eine kostenlose Testversion gibt. Darin sind 80 Stunden "Rechenzeit" enthalten. Ja Rechenzeit ist hier ein großes Stichwort. Die Server dahinter sind meistens versehen mit Grafikkarten. Die Abrechnung dieser Server wird in Euro/Stunde angegeben. Meistens sogar minutengenau abgerechnet. Die Preise die ich dir gleich nennen sind also nur die monatlichen Fixkosten und die Serverkosten sind die variablen Kosten. Ich denke, dass C3AI nicht zulässt eigene Server zu nutzen und von daher können sie ein Premium auf die Serverkosten schlagen. Diese Server können bei AWS, Azure oder Google Cloud eingekauft werden und diese vertreibt C3AI dann an ihre Endkunden mit einem zusätzlichen Aufschlag. Wie groß dieser ist, kann ich nicht abschätzen, aber es ist auf jeden Fall eine große Chance zusätzlichen Gewinn zu machen. Für bis zu 10 User sind die Fixkosten pro Monat 395$. Für bis zu 30 User sind die Fixkosten pro Monat 995$. In dem Preis sind noch weitere vorher genannte Features enthalten. Der Preis für Enterprise wird uns hier nicht verraten. Das gewählte Preismodell ist häufig vorzufinden bei Software-as-a-Service. Also der Kunde bekommt nicht einen Softwarestand bzw. einmalig ein Produkt, sondern der Kunde bekommt durch den Kauf, die Lizenz die Software für einen Monat zu nutzen. Zusätzlich werden dem Benutzer die Server bereitgestellt und diese werden auch in Rechnung gestellt, je nach Dauer der Benutzung. Wir haben hier also Infrastructure-as-a-Service-Modell on Top. C3AI stellt dem Kunden nicht nur die Software, sondern auch die Server um diese Software zu nutzen. C3AI kann dadurch eine konstanten Strom an Einkommen pro Monat machen. Als Aktionär finde ich sowas immer super und je mehr Kunden es gibt, desto mehr Einkommen wird durch dieses Preismodell generiert.

C3 AI Application

Das dritte Produkt sind schon vorgefertigte Modelle für spezielle Anwendungsfälle, die in vielen Unternehmen vorkommen. Ich habe mir mal das Datenblatt zum "C3 AI Anti-Money Laundering" angeguckt. Dahinter verbirgt sich ein Machine-Learning Modell, welches verschiedene Geldtransaktionen anguckt und anschließend klassifiziert. Das Modell beinhaltet, ohne jegliche Modifikation, 5000 Risikoanalysen. Jede Transaktion eines Bankkontoinhaber kann bewertet werden und dieser erhält dann einen Risiko-Score, über alle Transaktionen. Damit kann ein Mensch schnell ermitteln, wie hoch die Wahrscheinlichkeit ist, dass dieser Inhaber des Kontos Geld wäscht. Dieses Produkt spricht natürlich Banken an und der große Vorteil ist, dass dieses Modell schnell eingesetzt werden kann. In dem Datenblatt wird nur von 8-12 Wochen gesprochen. Die Entwicklungszeit, wenn die Bank einen solchen Service baut, würde diese Zeitspanne von 8-12 Wochen überschreiten. Je nach Menge der Daten und wie gut diese aufbereitet sind, kann so eine Entwicklung ein halbes Jahr oder ein ganzes Jahr dauern, wenn nicht sogar länger. Zurück zu C3AI. Zudem sind Modifikationen möglich, weshalb es kein starres Produkt ist. Es kann an die jeweilige Bank angepasst werden. Trotzdem bekommt die Bank dann ein individuelles System, welches automatisiert nach verdächtigen Geld Wäsche Transaktionen sucht und Bankkontoinhabern einen Risiko-Score zuweist. Das Produkt kann in kurzer Zeit produktiv eingesetzt werden und das ist ein sehr großer Vorteil. Welcher Preis dieses Produkt hat, kann nicht ermittelt werden.

Die anderen Modelle sind zudem für generelle Anwendungsfälle, die häufig auftreten. Die Menge an Modellen kann in Zukunft um weitere Anwendungsfälle erweitert werden. Je mehr es davon gibt, desto mehr Kunden könnten potenziell so einen Modell in Anspruch nehmen. Von daher bin ich sehr zuversichtlich, dass es hier noch Potenzial zum wachsen gibt. Unternehmen müssen auf C3AI aufmerksam werden und das Potenzial für ihre eigene Firma erkennen.  Über die Qualität, wie nützliche diese Modelle sind, kann ich keine Aussage treffen.

Wo ist der einzigartige Vorteil von C3AI?

  • Low-Code / Weniger Code
  • Schnelle Entwicklungszeit für den produktive Einsatz von künstlicher Intelligenz
  • Alles an einem Ort mit einer durchdachten Struktur
  • Daten können aus vielen Quellen geladen werden
  • Externe Frameworks wie Tensorflow usw. können verwendet werden
  • Vorgefertigte Modelle für häufig vorkommende Anwendungsfälle
  • Skalierbarkeit, Skalierbarkeit, Skalierbarkeit, Skalierbarkeit!

Was sind die Konkurrenten?

Die Konkurrent sind Google, AWS und Azure. Diese bieten ähnliche Saas-Produkte an.

C3.Ai hat ein Whitepaper zu einem Anwendungsfall veröffentlicht. Dieser Anwendungs war das Bauen einer Vorhersagen, wann Wartungsarbeiten anfallen, wenn zum Beispiel ein Gerät ausgefallen ist.
Was auffällt, ist die Zeit die es dauert, bis die Serverstruktur von AWS konfiguriert ist.  Die Konfiguration benötigt doppelt soviel Zeit, im vergleich zur kompletten C3Ai-Entwicklungszeit. Zudem ist die Dauer für das Testen und das bauen eines Programminterfaces in AWS extrem hoch. Da C3AI einen Art Baukasten mit Drag and Drop anbietet, ist diese Zeit drastisch reduziert worden. So einen Service habe ich bei AWS nicht finden können. Das zeigt, wie stark C3AI an alle Aspekte gedachte hat, die so ein typische Projekt aufweist.