Suche

Datenliebe

Dr. Meike Wocken – Beratung, Programmierung und Schulungen

Kategorie

Data Science

AG Industrie 4.0 – Bundesverband KI

Seit April 2021 leite ich die Arbeitsgruppe Industrie 4.0 im KI Bundesverband e.V., dem größten deutschen Netzwerk an Unternehmen, Startups und Entwickler:innen im Bereich künstlicher Intelligenz. In der AG sammeln sich alle, die intelligente Lösungen für die Probleme der Industrie anbieten können. Wir tauschen uns regelmäßig aus und planen für 2022 neue Formate, um unser Wissen auch nach außen zu tragen.

Unsere Arbeitsgruppe ist dabei immer auf der Suche nach Kontakten in die Industrie, um die Herausforderungen in diesem Bereich besser verstehen zu können. Wer gerne einmal sich, sein produzierendes Unternehmen und die durch KI und Automatisierung hoffentlich zu lösenden Probleme vorstellen möchte, ist herzlich eingeladen, mit mir in Kontakt zu treten.

Google Apps Script: Google Produkte leicht erweitern

Im beruflichen und privaten Umfeld nutze ich viele Produkte aus dem Google Workspace. Für den Digitaltag 2021 habe ich zum ersten Mal Google Apps Script verwendet, um die Funktionalitäten von Google Sheets zu erweitern für die Durchführung einer Open Data Rallye durchgeführt von Code for Bielefeld. Alle Infos dazu findet ihr auch in unserem Github Repository dazu.

Google Apps Script ist eine Skripting-Plattform basierend auf Javascript, die über den Google Account im gdrive zugänglich ist. Es ist ein Low Code Ansatz, um Erweiterungen zu ermöglichen, ohne auf professionelle Entwickler angewiesen zu sein.

Weiterlesen „Google Apps Script: Google Produkte leicht erweitern“

Farmhack 2019: zusammenhängende Signale, Peaks und Earth-Mover-Distance

Im Beitrag  zum Farmhack 2019 hatte ich bereits über die von mir bearbeitete Challenge berichtet. Wir waren insgesamt sieben Teammitglieder und hatten die Entwicklungsaufgaben aufgesplittet. Hier eine kurze Skizze meines Lösungsbeitrags mit R Code:

Weiterlesen „Farmhack 2019: zusammenhängende Signale, Peaks und Earth-Mover-Distance“

Statistik im Masterstudium Digitale Technologien: Zentraler Grenzwertsatz

Zur Vorbereitung meiner Vorlesung Statistik der Datenanalyse im Masterstudium Digitale Technologien an der FH Bielefeld habe ich heute u.a. die Vermittlung des Zentralen Grenzwertsatzes (ZGW) vorbereitet und einige Grafiken dazu in R erstellt.

Weiterlesen „Statistik im Masterstudium Digitale Technologien: Zentraler Grenzwertsatz“

Warenkorbinhalte clustern: Customer Analytics mit finite mixture models

Die Inhalte der Warenkörbe lassen Rückschlüsse auf die eigenen Kunden zu. Gibt es Warenkorbinhalte, die häufig zusammengekauft werden? Kann ich Informationen über meine Kundengruppen ableiten?

Eine Möglichkeit ist die Assoziationsanalysen. Aufgrund der Häufigkeiten von gemeinsam gekauften Produkten werden Regeln abgeleitet: Wenn X gekauft wird, dann wird auch Y gekauft. Das lässt allerdings die Heterogenität der Kundengruppe außer Acht. Es könnte sein, dass es eine Kundengruppe gibt, die zu Bratwürstchen immer Bier kauft, eine andere Kundengruppe hingegen zu Bratwürstchen kein Bier, dafür aber Salat-Zutaten im Warenkorb hat.

Eine andere Möglichkeit ist die Gruppierung der Warenkörbe zu verschiedenen Clustern. Clustering-Verfahren sind unsupervised, d.h. rein datengetrieben werden die Gruppen gebildet: innerhalb der Gruppe gibt es eine hohe Ähnlichkeit der Warenkorbinhalte, zwischen den Gruppen gibt es große Unterschiede.

Weiterlesen „Warenkorbinhalte clustern: Customer Analytics mit finite mixture models“

Chatbot bauen und Nachfrage prognostizieren: das nächste Data Science Meetup steht in den Startlöchern

Wir vom Data Science Bielefeld Team freuen uns, am 11.7.2019 um 19 Uhr in der Bürgerwache Bielefeld gleich zwei Referenten begrüßen zu dürfen. Zum einen kommt Matthias Ulrich, REWE Digital GmbH, zu uns mit einem Vortrag zum Thema „Distributional regression and model selection for demand forecasting in e-grocery“.

Weiterlesen „Chatbot bauen und Nachfrage prognostizieren: das nächste Data Science Meetup steht in den Startlöchern“

Windy gridworld: klassisches RL Problem mit R gelöst

Machine Learning versucht, basierend auf Erfahrungen Wissen über Entscheidungen zu generieren mit dem Ziel selbständig Entscheidungen treffen zu können. Erfahrungen sind dabei i.d.R. Daten aus der Vergangenheit, sogenannte Trainingsdaten. Die gewählten Trainingsdaten beeinflussen stark die Qualität der Entscheidungen, die der ML Algorithmus nach dem Training selbständig trifft. Nur so gut, wie die vergangenen Entscheidungen waren, kann dann der Algorithmus auch für zukünftige Entscheidungen lernen. Eine Ausnahme ist dabei das Reinforcement Learning. Über ein Belohnungssystem lernt der Algorithmus selber, welche Entscheidung die Belohnung maximiert.

Anfang Januar 2019 hatten wir bei unserem Data Science Bielefeld Meetup (www.datascience-bielefeld.de) Marcus Cramer (Head of Analytics) und David Middelbeck (Head of Product) von Westphalia DataLab bei uns zu Gast, die etwas zu “Reinforcement Learning – Optimierung von Logistikprozessen” erzählt hatten. Marcus hatte mit dem windy gridworld eines der klassischen Reinforcement Learning Beispiele mitgebracht.

Weiterlesen „Windy gridworld: klassisches RL Problem mit R gelöst“

Daten aus Google BigQuery mit R analysieren

BigQuery ist ein leicht skalierbares Data Warehouse in der Google Cloud. Mit Standard SQL Abfragen kann auf Daten zugegriffen werden und mittels R-Paket bigrquery kann ich Daten aus BigQuery auch leicht in R verwenden. BigQuery, der Hidden Champion von Google 🙂 Weiterlesen „Daten aus Google BigQuery mit R analysieren“

Optimierungsalgorithmen: Anwendungsbeispiele des genetischen Algorithmus

Machine Learning (ML) Methoden sind eng verknüpft mit Optimierungsverfahren. Im ML wird in der Regel eine Zielfunktion definiert, deren Optimum mittels Optimierungsalgorithmus ermittelt werden muss. Auch zur Verbesserung von ML Methoden kann Optimierung verwendet werden, z.B. bei der Feature Selection (ein Anwendungsbeispiel gibt es unten im Beitrag). Daneben können Optimierungsmethoden auch im Operations Research eingesetzt werden, um komplexe, mathematisch formulierte Probleme z.B. aus dem Bereich Supply Chain- und Logistik-Optimierung zu lösen. Weiterlesen „Optimierungsalgorithmen: Anwendungsbeispiele des genetischen Algorithmus“

Erstelle eine Website oder ein Blog auf WordPress.com

Nach oben ↑