-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
lavoro di pulizia sui CSV #2
Comments
Ciao Andrea, scusa x il ritardo con cui rispondo ma dal ritorno da SOD16 non ho avuto Il nostro lavoro di "montaggio" e' stato fatto molto velocemente man mano Questa è anche la ragione x cui x questi dati NON ho creato i Quindi i dati sono SI da ripulire e quindi ben venga il tuo contributo (e Resta da capire la "confrontabilita'" dei dati tra loro anche e non solo Grazie Andrea del tuo prezioso contributo e se servono altre info chiedi A risentirci presto perché ho letto le varie mail scambiate e ho delle Buona serata .... Cesare Il mercoledì 11 maggio 2016, Andrea Borruso notifications@github.com ha
Cesare Gerbino http://cesaregerbino.wordpress.com/ Questo è un account di posta personale di Cesare Gerbino: tutte le opinioni This is Cesare Gerbino mail account. Text is written by Cesare Gerbino: |
Esatto: il punto fondamentale è decidere il modello del dato finale, quali colonne ci servono etc. A occhio una delle cose da cui partire è l'esperienza che ha fatto Davide Mancino per l'inchiesta uscita su Wired, dove aveva usato i dati del 2010. |
Cari @cesaregerbino e @dagoneye i dati di questa cartella su cui ho iniziato a mettere il naso sono del 2013. Mentre quelli da cui partire sono del 2010. Mi fermo? Quando dite (scusatemi non ho letto tutto) dati del 2010 fate riferimento a quelli INAIL? Nella scheda anagrafica non trovo altri riferimenti al 2010. Grazie |
2016-05-11 20:03 GMT+02:00 cesaregerbino notifications@github.com:
Questa la sai già, ma un altro formato di gran comodità è il geojson. Per [image: Inline images 1] Andrea Borruso "cercare e saper riconoscere chi e cosa, Italo Calvino |
infatti avevo risposto velocemente pensando al json ...... per le Cesare Gerbino Il giorno 12 maggio 2016 09:22, Andrea Borruso notifications@github.com
|
@aborruso al volo: ottima l'idea di inserire un readme con le note sulla fonte all'interno delle singole cartelle, ci fa fare meno casino. |
Ciao Andrea, provo a fare mente locale .... >>Quando dite (scusatemi non ho letto tutto) dati del 2010 fate >>i dati di questa cartella su cui ho iniziato a mettere il naso sono del I dati sono e saranno, in questa fase, riferiti ad epoche diverse (ad Mi spiace di non avere notizie più "risolutive" ... Buona serata Cesare Gerbino Il giorno 12 maggio 2016 10:03, Matteo Brunati notifications@github.com
|
Ciao,
nella cartella /dati/MinAmbiente/PNA_W/ ci sono diversi CSV. Vorrei capire con voi e sopratutto con @cesaregerbino che ha un po' seguito la parte di "montaggio" dei dati se ha senso un lavoro di pulizia di base.
Ho preso in esame soltanto uno dei file
Campania_2013.csv
e ho applicato il seguente comando:In questo modo:
,
La standardizzazione consente un comodo preview dentro github, ma anche (ad esempio) un import diretto in cose alle gdrive.
Ho fatto altre due cose:
csvstat
- un file che descrive il suddetto file CSV.Il file è da pulire ulteriormente e ci sono problemi di caratteri "strani" ancora da risolvere. Volevo capire se vi sembra utile procedere in questo senso anche con gli altri CSV.
Saluti
The text was updated successfully, but these errors were encountered: