Informationen zum Open Data Codefest
Um Dir den Einstieg zu erleichtern, haben wir ein paar Portale zusammen gesucht, welche Datensätze offen anbieten. Aufgrund der Vielzahl von Datensätzen können wir die Seriösität der einzelnen Datensätzen nicht überprüfen. Hier gilt wie für Alles im Internet, hier können Daten dabei sein die unvollständig, verfälscht oder schlichtweg frei erfunden sind. Wir bitten Dich das immer im Hinterkopf zu behalten und die von Dir genutzen Daten bei Bedarf selber durch Quellen zu verifizieren.
Beachte bitte auch, dass verschiedene Datensätze unter verschiedenen Lizenzen bereit gestellt werden. Bevor Du einen Datensatz herunterlädst und benutzt empfehlen wir Dir, die jeweilige Lizenz zu lesen und zu beachten.
- Kaggle
- Schneller und einfacher Einstieg in den Bereich Open Data
- Vielseitige von nutzern erstellte Datensets
- Bietet auch eine Online Umgebung an
- Vorsicht: Die Daten sind ungeprüft und jeder kann dort ein Datensatz erstellen und hochladen.
- GovData
- Datensammlung von verschiedenen deutschen Behörden und Ämtern
- große Auswahl an öffentlichen Daten
- entwickelt im Auftrag des Bundesministeriums des Innern
- Spaß mit Daten
- Einstieg in Open Data
- Bietet neben Datensätzen auch eine Liste mit Tools für die Verarbeitung von Daten
- wird von einer Privatperson betrieben
- Wikipedia Machine Learning Datasets
- List of datasets for machine-learning research
- in verschiedene Kategorien aufgeteilt
- Die Wikipedia Community überprüft zwar Bearbeitungen, trotzdem kann es passieren, dass falsche Informationen dort zu finden sind
- osf.io
- Public research Sammlung
- Hier können Wissenschaftler ihre Forschungsdaten veröffentlichen bevor ihre Auswertung abgeschlossen ist.
- wissenschaftlich orientierte Daten aus verschiedenen Bereichen
- Pisa Ergebnisse
- Antworten aller Teilnehmer aus verschiedenen Jahren
- Jugend hackt > Offene Daten
- verschiedene Datenlisten der einzelnen Behörden, Ämter und Länder
- Jugend hackt > lose Sammlung
Schnelltesttest.de bietet dir einen einfachen Weg, Informationen über die vom Paul-Ehrlich-Institut evaluierten SARS-COV-2-Antigen-Schnelltests abzurufen.
Nutzt die RKI Corona Infektionen der Woche und rechnet aus wie häufig sich im Durchschnitt jemand in Deutschland infiziert.
Datensatz aus dem Forschungsprojekt "AVAPS". Vorhersage der Bauteilqualität mit Hilfe der Prozessdaten einer Spritzgießmaschine. Explorative Datenanalyse und Machine learning mit den Daten.
https://github.com/micromata/open-data-codefest/tree/main/avaps
Durchforste aktuelle und vergangene eBay Listings zu bestimmten Artikeln um eine Preisentwicklung herauszufinden.
Auswirkung guter innerstädtischer Fahrrad Infrastruktur auf die Luftqualität (Ausbau der Fahrradwege in der Stadt in Korrelation zu CO2 Daten).
Die Willkommenspräsentation findet ihr hier zum Download: