Il primo è il Base Plotting System, fornito di default con R.
Usandolo si crea prima il grafico con una funzione, poi si usano funzioni specifiche per aggiungere annotazioni o modificarlo.
Ad esempio, ipotizziamo di avere una tabella "auto" con i dati di "consumo" e di "accelerazione" di una serie di automobili, e di voler fare un grafico esplorativo per vedere se c'è una correlazione tra le due variabili. Faremo prima un grafico a dispersione con "consumo" sull'asse x:
plot(auto$consumo, auto$accelerazione)
e successivamente potremo cambiare titolo, colori, assi, ecc... nell'esempio inserisco un testo all'altezza del valore più alto di accelerazione e del valore medio di consumo:
text(mean(auto$consumo), max(auto$accelerazione),"testo!")
La seconda libreria è la "Lattice System" da scaricare con il package "lattice". A differenza del precedente, i grafici "lattice" sono creati con una singola funzione, in cui bisogna inserire sia il grafico che le varie aggiunte, modifiche e annotazioni.
Usando l'esempio precedente, ipotizziamo che nella tabella ci siano le auto di quattro marche diverse con la variabile "marca" che le identifica, potremmo fare un grafico del genere:
xyplot(consumo ~ accelerazione | marca, data=auto, layout=c(2,2))
che ci consentirà di ottenere uno spazio 2x2 (con layout=c(4,1) avremmo avuto un 4x1), con un grafico a dispersione per ogni marca.
Il terzo modo per creare grafici è con il "ggplot2", una via di mezzo tra i primi due (anche questa da scaricare e installare). E' possibile nella funzione del grafico specificare alcune aggiunte come titolo, spazi, annotazioni, ma è anche possibile aggiungere successivamente altre cose. A mio avviso è decisamente la libreria migliore delle tre.
Già facendo un semplice grafico a dispersione come quello fatto all'inizio ma con il comando qplot:
qplot(consumo, accelerazione, data=auto)
vi accorgerete che il risultato è decisamente più gradevole alla vista e moderno.
No comments:
Post a Comment