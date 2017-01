DigitalisierungDigitalisierung war gestern, heißt es beim Kasseler Analystenhaus Crisp Research. Dort spricht man bereits vom "post-digitalen Zeitalter", in dem Maschinen und Roboter mit menschlichen Eigenschaften agieren. "Die Phase der Quick Wins ist vorbei, Digitalisierung muss echte Probleme lösen", forderte Crisp-CEO Carlo Velten auf einer Fachkonferenz des Marktforschungs- und Beratungsunternehmens.

Mit den Quick Wins meint er beispielsweise Startups wie Uber oder Firmen, die "mal ein paar Apps gebaut haben, um den digitalen Rahm abzuschöpfen." Unternehmen, die eine echte digitale Wertschöpfung schaffen wollten, stünden vor anderen Herausforderungen und müssten sich fragen, welche Veränderungen das "post-digitale Zeitalter" mit sich bringe. Zu den zukunftsträchtigen Technologien in diesem Kontext zählt er Künstliche Intelligenz und maschinelles Lernen. Deren Einfluss auf alle Unternehmensbereiche nehme rapide zu und werde insbesondere in der IT immens sein. Gerade IT-Verantwortliche täten gut daran, sich schon jetzt mit einschlägigen Konzepten und Plattformen auseinanderzusetzen.

Machine Learning kommt aus der Nische

Nach Jahren in der akademischen Nische erlebe das Thema Machine Learning eine Innovations- und Wachstumsphase, erläuterte Björn Böttcher, Senior Analyst und Spezialist für das Thema Data bei Crisp Research. Die Gründe dafür sieht er unter anderem in der skalierbaren und kostengünstigen Rechenleistung aus der Cloud.

Die Verfügbarkeit riesiger Datenmengen bilde die Grundlage für die Modellentwicklung und das Training der Systeme. Verfahren, Tools und Frameworks hätten sich durch milliardenschwere Investitionen deutlich verbessert. Vor allem aber gebe es mittlerweile viele neue Use Cases, sowie die Notwendigkeit, die anfallenden Datenmengen im Rahmen von Big-Data-Vorhaben zu beherrschen und zu analysieren.

Wie ernst viele Unternehmen das Thema maschinelles Lernen bereits nehmen, ist in vielen Bereichen erkennbar. So haben laut Böttcher allein FacebookFacebook, GoogleGoogle, MicrosoftMicrosoft, IBMIBM und AmazonAmazon Web Services (AWS) im Jahr 2015 zehn Milliarden Dollar in einschlägige Forschung und Entwicklung gepumpt. Von 2014 bis Anfang 2016 gab es 81 Akquisitionen in dem Bereich. Auch an den HR-Investitionen werde der Trend deutlich. Etliche Großunternehmen bildeten Teams und heuerten verstärkt Machine-Learning-Experten an. Dabei erleichterten Open-Source- und Open-Data-Tools den Zugang zu den neuen Technologien. Böttcher: "Machine Learning ist schon heute Basis für viele Dienstleistungen und Produkte."

Der Weg in die post-digitale Welt

Doch es sind nicht nur technische Herausforderungen, die Unternehmen beim Übergang in die (post-)digitale Welt meistern müssen. Crisp-Chef Velten beschreibt eine Reihe von strategischen Veränderungen, auf die sich IT- und Business-Verantwortliche einstellen sollten. Digital Labs gälten zwar vielerorts als Keimzelle digitaler InnovationInnovation. Doch ihr Erfolg sei keineswegs garantiert. Irgendwann müsse sich aus den mit viel Geld etablierten Labs ein digitales Business entwickeln. Der Erwartungsdruck hinsichtlich des Umsatzbeitrags digitaler Produkte und Services sei hoch, erste Labs hätten schon wieder dichtgemacht.

Massive Auswirkungen werde die Wandlung großer Industrieunternehmen hin zu Softwarekonzernen haben, erwarten die Analysten. BoschBosch, SiemensSiemens und GE mit seiner Predix-Plattform entwickelten sich damit auch zu Konkurrenten großer IT-Player wie SAPSAP oder IBM, wenn es um Wachstumsfelder wie IoT, Analytics und Cloud gehe. Das wiederum heize den "War of Talents" weiter an. Spezialisten für Analytics, Machine Learning oder IoT würden schon jetzt händeringend gesucht.

Apache Spark MLlib

Früher als Teil des Hadoop-Universums bekannt, ist Apache Spark mittlerweile ein bekanntes Machine-Learning-Framework. Sein umfangreiches Angebot an Algorithmen wird ständig überarbeitet und erweitert. Apache Singa

Singa, seit kurzem Teil des Apache Incubator, ist ein Open-Source-Framework, das Deep-Learning-Mechanismen auf große Datenvolumen hin „trainieren“ soll. Singa stellt ein simples Programmierungsmodell für Deep-Learning-Netzwerke bereit und unterstützt dabei diverse Entwicklungsroutinen. Caffe

Caffe umfasst ein ganzes Set von frei verfügbaren Referenzmodellen für gängige Klassifizierungsroutinen; die gewachsene Caffe-Community steuert weitere Modelle bei. Caffe unterstützt die Nvidia-Programmiertechnik CUDA, mit der Programmteile wahlweise auch durch den Grafikprozessor (GPU) abgearbeitet werden können. Microsoft Azure ML Studio

Weil die Cloud also die ideale Umgebung für ML-Anwendungen darstellt, hat Microsoft seine Azure-Cloud mit einem eigenen ML-Service auf der Basis von „pay as you go“ ausgestattet: Mit Azure ML Studio können Nutzer KI-Modelle entwickeln und trainieren und anschließend in APIs umwandeln, um diese wiederum Anderen zur Verfügung zur stellen. Amazon Machine Learning

Amazon Machine Learning arbeitet mit Daten, die in einer Amazon-Cloud wie S3, Redshift oder RDS liegen und kann mithilfe binärer Klassifizierungen und Multiklassen-Kategorisierung von vorgegebenen Daten neue KI-Modelle bauen. Microsoft DMTK

Das DMTK (Distributed Machine Learning Toolkit) von Microsoft soll ML-Anwendungen über mehrere Maschinen hinweg skalieren. Es ist eher als "Out of the Box"-Lösung gedacht und weniger als Framework - entsprechend gering ist die Anzahl der unterstützten Algorithmen. Google TensorFlow

TensorFlow basiert auf sogenannten Data-Flow-Graphen, in denen Bündel von Daten („Tensors“) durch eine Reihe von Algorithmen verarbeitet werden, die durch einen Graph beschrieben sind. Die Bewegungsmuster der Daten innerhalb des Systems heißen „Flows“. Die Graphen lassen sich mittels C++ und Python zusammenbauen und via CPU oder GPU verarbeiten. Microsoft CNTK

Das Microsoft Computational Network Toolkit funktioniert ähnlich wie Google TensorFlow: Neuronale Netze lassen sich durch gerichtete Graphen erzeugen. Microsofts eigener Beschreibung zufolge lässt sich CNTK außerdem mit Projekten wie Caffe, Theano und Torch vergleichen – sei aber schneller und könne im Gegensatz zu den genannten gar parallel auf Prozessor- und Grafikprozessorleistung zugreifen. Samsung Veles

Das Samsung-Framework ist dazu gedacht, Datensätze zu analysieren und automatisch zu normalisieren, bevor sie in den Produktivbetrieb übergehen – was wiederum durch eine eigene API namens REST sofort möglich ist – vorausgesetzt, die eingesetzte Hardware hat genügend Power. Der Python-Einsatz in Veles umfasst auch ein eigenes Analyse- und Visualisierungstool namens Jupyter (früher IPython) für die Darstellung einzelner Anwendungs-Cluster. Brainstorm

Brainstorm setzt auf Python, um zwei Data-Management-APIs („Handers“ genannt) bereitzustellen – eine für CPU-Prozessing durch die Bibliothek „Numpy“ und eine für GPU-Verarbeitung via CUDA. Eine benutzerfreundliche GUI ist in Arbeit. mlpack 2

Die neue Version der in C++ geschriebenen Machine-Learning-Bibliothek mlpack, die erstmals im Jahr 2011 erschien, bringt eine Menge Neuerungen mit – darunter neue Algorithmen und überarbeitete alte. Marvin

Der Quellcode von Marvin ist sehr übersichtlich - die enthaltenen vortrainierten Modelle (siehe Bild) ermöglichen aber bereits eine umfangreiche Weiterentwicklung. Neon

Neon von NervanaSystems ist ein Open-Source-Framework, das auf ein- und abschaltbaren Modulen basiert und KI-Prozesse via CPU, GPU oder Nervanas eigener Hardware ermöglicht.

"Hardware is back"

Einen weiteren Trend beschreibt Crisp Research mit dem Slogan "Hardware is back". Dahinter steht die Beobachtung, dass große Technologieunternehmen zunehmend auch die Hardware beherrschen wollten. AppleApple mit seiner Kontrolle über den kompletten Technologie-Stack gilt vielen als leuchtendes Beispiel. Längst arbeiten auch andere IT-Größen wie Facebook oder Google an speziell auf ihre Services zugeschnittenen Hardware-Systemen.

"Digitale Wertschöpfungsketten und Ökosysteme lassen sich nachhaltig nur in Kombination von Hardware, Software und Service gestalten", sagt Velten dazu. 3D-Druck, Robotics, Simulation und CAD demokratisierten die Hardwareproduktion und gäben Internetfirmen und Startups Zugang zu Märkten, die bislang eine Domäne der Industrieunternehmen waren. Die eigentliche Produktion und Logistik übernähmen dabei Fremd- und Auftragsfertiger.