fredag 11 maj 2007

11/5 – 10:15 – 11:30 – Microsoft SQL Server Data Mining (Donald Farmer)

”A plattform for intelligent applications”

Data mining är en plattform för att förutse och förutspå data genom olika algoritmer. Man bygger upp en mining modell som man sedan ”tränar” med testdata. När detta är klart kan man köra modellen med data som man vill använda för att förutspå resultat.

Processen är följande:
1. Data understanding (SQL DSV, Excel, query)
2. Data preparation (SSIS, SSAS, Excel)
3. Data modelleing / Evaluation (Data mining, Excel)
4. Deployment (SSIS, SSAS, SSRS, Excel mm.)
5. Business understanding

Vi fick se en demo där han i ett Analysis Services projekt skapade en Data source, Data source view och en Mining structure. Därefter finns det olika algoritmer att välja som Microsoft skickar med. Donalds råd var att man testar de olika för att först vad de returnerar. Han valde att köra ”Decision tree” och sedan definierade han vilken kolumn och datatyp som skulle användas för ”Prediction”. För att testa sin modell finns en Mining modell prediction.
Språket för Data mining heter DMX.

Data Mining är ett intressant ämne som jag gärna sätter mig in i om man jag får tid över och något lämpligt data att testa på.

Inga kommentarer: