2014-10-28
Detta är rĂ¥manus till en dragning jag höll pĂ¥ Pensionsmyndigheten i oktober 2014. Originalet finns i Markdown-form här och en HTML-variant finns här
Allt kortare tid till modell + visualisering. Allt mer data samlas och analyseras i tabellform, t.ex. data.frame()
/data.table()
.
dplyr
: kraftigt förkortad tid för ett flertal databearbetningsutmaningarggvis
: förenklad interaktiv visualiseringtidyr
: underlättad omstrukturering av dataDet stora utvecklingsomrĂ¥det de kommande Ă¥ren. Metoder för bĂ¥de enkel och avancerad modellering blir allt mer lättilgängliga
caret
: En frontend för ett mycket stort antal modelleringspaket i Rcaret
caret
är ett paket för att mcyket snabbt preparera data för modellering och mycket snabbt tillämpa en enorm uppsättning analysmetoder (t.ex. GLM, Random Forest, neurala nätverk, etc.). Resultaten är direkt jämförbara, även om de underliggande modellerna är extremt olika. Detta arbetssätt är utan tvekan framtiden för analytiskt arbete!
Den ökade tillgĂ¥ngen pĂ¥ lättanvända programmeringssprĂ¥k och ökade programmeringskunskaper gör att grundläggande kunskaper om statistik och/eller programmering inte längre är en framgĂ¥ngsfaktor. "Alla är analytiker" hĂ¥ller pĂ¥ att bli ett ledord.
WYSIWYG-verktyg och closed source tappar mark som plattformar för dataanalys. SPSS och SAS ger stadigt vika för R, Julia och Python.
Open data ökar starkt i tillgänglighet. Flera vägar finns för att samla in data frĂ¥n öppna datakällor, t.ex. flera R-paket.
pxweb
(SCB, m.fl. myndigheter)ROpenSci
Quandl
Fler alternativ allt mer tillgängliga och lättanvända.
Statistisk programmering genomgĂ¥r just nu en stor utveckling. Dessa är nĂ¥ga exempel pĂ¥ omrĂ¥den där helt nya tekniker utvecklats under de senaste 1-2 Ă¥ren:
shiny
caret
dplyr
, ggvis
, tidyr
Teamet bakom RStudio är den drivande motorn för det verkligt innovativa i R-världen just nu.
De och Julia-teamet stĂ¥r uppskattningsvis för 80-90% av den uppmärksamhet som riktats mot statistik programmering de senaste Ă¥ren.
http://lchansson.com/R-och-Analytics/ love.hansson@gmail.com