Suche

Datenliebe

Dr. Meike Wocken – Beratung, Programmierung und Schulungen

Kategorie

Allgemein

Liftoff 2021

Gerne möchte ich wieder mehr Einblicke in meine Arbeit geben. Mit Kindern im Homeoffice habe ich diesen Blog im letzten Jahr leider sehr vernachlässigt. Passend zu diesem neuen Start ist auch das Thema für den ersten Blogbeitrag: Liftoff.

Dabei handelt es sich ausnahmsweise nicht um ein Data Science Thema, sondern um ein Thema aus dem Bereich agiles Arbeiten. Es ist eine Methode, wie Team-fokussiert Projekt-Kickoffs durchgeführt werden können und als Arbeitsergebnis eine gemeinsame Team-Charta entsteht.

Weiterlesen „Liftoff 2021“

Wieder Teil eines Teams

Seit Anfang des Jahres gehöre ich mit zum Team von http://www.codecentric.de codecentric ist ein agiles Softwarehaus, mit großer Erfahrung im Bereich Smart Data, AI und Cloud.

Gemeinsam sind wir mit einem Standort in Bielefeld im Pioneers Club für euch da und können in vielen Bereichen weiterhelfen…
…. Engineering, Integration, Security, Managed Services, ….. Workshops, Digital Product Development, Team Enabling, ….

Schreibt mich doch einfach an! Creating the digital future together! Weiterlesen „Wieder Teil eines Teams“

Können wir Machine-Learning-Modelle verstehen?

Digital Gym, 11.12.2019, Pioneers Club Bielefeld, 16 – 17:30 Uhr

Machine Learning Verfahren können Objekte, z.B. Kunden, anhand ihrer Eigenschaften automatisiert bestimmten Klassen, beispielsweise „Kunde ist abwanderungsbedroht“ zuordnen. Dafür gibt es unterschiedliche Klassifikationsmodelle, die sich in ihren Algorithmen und ihrer Komplexität unterscheiden. Ein einfaches Modell ist leicht verständlich und nachvollziehbar, aber gleichzeitig nicht fähig, komplexe Zusammenhänge abzubilden und somit genaue Vorhersagen für Testdaten zu liefern. Komplexe Modelle sind im Wesentlichen „Blackbox“-Verfahren, die i.d.R. gute Prognoseergebnisse liefern.  Weiterlesen „Können wir Machine-Learning-Modelle verstehen?“

Farmhack 2019: 2. Platz fürs Kuhmonitoring!!

Vom 16. bis 17. Oktober 2019 fand der Farmhack (www.farmhack.de) im Rahmen der Innovate Convention in Osnabrück (www.innovate-os.de) statt. Ich hatte mich der Challenge gestellt, innderhalb der zwei Tage digitale Lösungsansätze für Herausforderungen der Agrarbranche zu entwickeln. Organisiert wurde das Event unter anderem von Fraunhofer Venture, welches für das Ausgründungs- und Beteiligungsmanagement der Fraunhofer-Gesellschaft verantwortlich ist. Weiterlesen „Farmhack 2019: 2. Platz fürs Kuhmonitoring!!“

Hervorgehobener Beitrag

Statistik im Masterstudium Digitale Technologien: Zentraler Grenzwertsatz

Zur Vorbereitung meiner Vorlesung Statistik der Datenanalyse im Masterstudium Digitale Technologien an der FH Bielefeld habe ich heute u.a. die Vermittlung des Zentralen Grenzwertsatzes (ZGW) vorbereitet und einige Grafiken dazu in R erstellt.

Weiterlesen „Statistik im Masterstudium Digitale Technologien: Zentraler Grenzwertsatz“

Warenkorbinhalte clustern: Customer Analytics mit finite mixture models

Die Inhalte der Warenkörbe lassen Rückschlüsse auf die eigenen Kunden zu. Gibt es Warenkorbinhalte, die häufig zusammengekauft werden? Kann ich Informationen über meine Kundengruppen ableiten?

Eine Möglichkeit ist die Assoziationsanalysen. Aufgrund der Häufigkeiten von gemeinsam gekauften Produkten werden Regeln abgeleitet: Wenn X gekauft wird, dann wird auch Y gekauft. Das lässt allerdings die Heterogenität der Kundengruppe außer Acht. Es könnte sein, dass es eine Kundengruppe gibt, die zu Bratwürstchen immer Bier kauft, eine andere Kundengruppe hingegen zu Bratwürstchen kein Bier, dafür aber Salat-Zutaten im Warenkorb hat.

Eine andere Möglichkeit ist die Gruppierung der Warenkörbe zu verschiedenen Clustern. Clustering-Verfahren sind unsupervised, d.h. rein datengetrieben werden die Gruppen gebildet: innerhalb der Gruppe gibt es eine hohe Ähnlichkeit der Warenkorbinhalte, zwischen den Gruppen gibt es große Unterschiede.

Weiterlesen „Warenkorbinhalte clustern: Customer Analytics mit finite mixture models“

Windy gridworld: klassisches RL Problem mit R gelöst

Machine Learning versucht, basierend auf Erfahrungen Wissen über Entscheidungen zu generieren mit dem Ziel selbständig Entscheidungen treffen zu können. Erfahrungen sind dabei i.d.R. Daten aus der Vergangenheit, sogenannte Trainingsdaten. Die gewählten Trainingsdaten beeinflussen stark die Qualität der Entscheidungen, die der ML Algorithmus nach dem Training selbständig trifft. Nur so gut, wie die vergangenen Entscheidungen waren, kann dann der Algorithmus auch für zukünftige Entscheidungen lernen. Eine Ausnahme ist dabei das Reinforcement Learning. Über ein Belohnungssystem lernt der Algorithmus selber, welche Entscheidung die Belohnung maximiert.

Anfang Januar 2019 hatten wir bei unserem Data Science Bielefeld Meetup (www.datascience-bielefeld.de) Marcus Cramer (Head of Analytics) und David Middelbeck (Head of Product) von Westphalia DataLab bei uns zu Gast, die etwas zu “Reinforcement Learning – Optimierung von Logistikprozessen” erzählt hatten. Marcus hatte mit dem windy gridworld eines der klassischen Reinforcement Learning Beispiele mitgebracht.

Weiterlesen „Windy gridworld: klassisches RL Problem mit R gelöst“

Digitalisierung und KI in OWL

Nächste Woche halte ich an der FH Bielefeld einen Vortrag zu Chancen und Risiken intelligenter Datennutzung für den Mittelstand.

Das Programm der gesamten Veranstaltung Digitalisierung und KI in OWL: gender- und kompetenzbezogene Betrachtung + Anmeldung findet ihr hier: https://www.fh-bielefeld.de/hochschule/veranstaltungen/31-01-2019-digitalisierung-und-ki-in-owl

Ich freu mich drauf 🙂

Optimierungsalgorithmen: Anwendungsbeispiele des genetischen Algorithmus

Machine Learning (ML) Methoden sind eng verknüpft mit Optimierungsverfahren. Im ML wird in der Regel eine Zielfunktion definiert, deren Optimum mittels Optimierungsalgorithmus ermittelt werden muss. Auch zur Verbesserung von ML Methoden kann Optimierung verwendet werden, z.B. bei der Feature Selection (ein Anwendungsbeispiel gibt es unten im Beitrag). Daneben können Optimierungsmethoden auch im Operations Research eingesetzt werden, um komplexe, mathematisch formulierte Probleme z.B. aus dem Bereich Supply Chain- und Logistik-Optimierung zu lösen. Weiterlesen „Optimierungsalgorithmen: Anwendungsbeispiele des genetischen Algorithmus“

Create a website or blog at WordPress.com

Nach oben ↑