Suche
Suche Menü

Schlangen: Die Brücke zwischen Data Science und Anwendung

In unserer Stormingphase haben wir verschiedene DataScience-Tasks in Subteams bearbeitet, die sich hauptsächlich für R und Python entschieden haben. Beide Sprachen bieten sich für folgende DataScience-Tasks super an: Explorieren Säubern Filtern Aggregieren Visualisieren Verwenden von Machine Learning Algorithmen Fremdbibliotheken für schnelles Prototyping einbinden R ist auf …

Weiterlesen

Some Learnings in Hive

Hive gehört zum Hadoop Ökosystem und ermöglicht das Abfragen seiner Daten, die im HDFS liegen. Das HDFS ist das verteilte Dateisystem in Hadoop, das ermöglicht extrem große Datenmengen zu persistieren, indem diese verteilt auf dem Cluster abgelegt werden.  Mit Hive wird eine Metastruktur auf den Daten …

Weiterlesen

Qudosoft goes Big Data

„Qudosoft goes Big Data“ ist eine fortlaufende Serie von Blogposts in der wir unsere Erfahrung unserer ersten Schritte und herausgefundenen Best Practices beschreiben. In dem ersten Blogpost gehen wir auf den Cluster und die genutzte Software ein. Seit Anfang dieses Jahres gibt es bei der Qudosoft …

Weiterlesen

Agile Softwareentwicklung