Visų tyrimų duomenys turi būti ruošiami analizei. Tai atlikti galima naudojantis IBM SPSS Statistics Base, tačiau neretai duomenims paruošti reikia specializuotų metodų. Papildomas IBM SPSS Data Preparation modulis suteikia šias galimybes ir leidžia Jums:
Sužinokite, kaip IBM SPSS Data Preparation procedūros gali padėti greičiau paruošti duomenis analizei ir gauti tikslesnius rezultatus.
IBM SPSS Data Preparation galima įsigyti anglų, japonų, prancūzų, vokiečių, italų, ispanų, kinų, korėjiečių ir rusų kalbomis
IBM SPSS Data Preparation modulyje esantys metodai padės paruošti duomenis ir lengviau bei tiksliau atlikti analizę. Kaip ir visi papildomi IBM SPSS Statistics moduliai, IBM SPSS Data Preparation gali dirbti atskirai arba kartu su kitais IBM SPSS Statistics moduliais, išplečiančiais Jūsų galimybes.
Paprastai duomenų patvirtinimas atliekamas rankiniu būdu, tačiau tai ilgas ir varginantis procesas. Jūs galite rasti duomenų dažnius, pažymėti įtartinas vietas ar vietas kurias reikia taisyti, vėliau pasirinkti stebėjimus pagal numerį ir taisyti duomenis. Tai varginantis procesas, o dėl to, kad šis procesas nėra standartizuotas, gali kilti projekto vientisumo problemų.
Norėdami išvengti visų šių sunkumų pasirinkite Validate Data procedūrą. Ši procedūra leidžia duomenims taikyti nustatytas taisykles ir tikrinti juos priklausomai nuo tipo (tolydieji ar diskretieji). Pavyzdžiui, jei renkami penkių padalų skalės duomenys, galima tikrinti duomenis ar nėra reikšmių nepriklausančių [1; 5] intervalui, jei tokių duomenų randama jie yra pažymimi. IBM SPSS Data Preparation gali pateikti ataskaitas apie konkrečius atvejus arba apie visus šios taisyklės pažeidimus ir paveiktų kintamųjų kiekį. Taip pat galite nustatyti taisykles konkretiems kintamiesiems (pavyzdžiui kitimo sritis) ar tarp kintamųjų (pavyzdžiui bedarbiams gaunantiems daugiau, nei 10 000Lt mėnesines pajamas). Šios galimybės leidžia tikrinti duomenų tinkamumą ir prieš analizę pataisyti įtartinus duomenis arba pašalinti netinkamus stebėjimus.
Išskirtinės reikšmės dažnai iškraipo rezultatus, Anomaly Detection procedūra leidžia užkirsti tam kelią. Ši procedūra atrenka išskirtines reikšmes pagali panašių stebėjimų sklaidą ir pateikia sklaidos paaiškinimą. Išskirtines reikšmes galima pažymėti sukuriant atskirą kintamąjį. Atrinkę išskirtinius stebėjimus galite atlikti tolesnę analizę ir nustatyti ar įtraukti šiuos stebėjimus į analizę.
INorėdami taikyti algoritmus, kurie yra skirti vardinėms savybėms (pavyzdžiui Naïve Bayes ar logit modelius), pirmiausia turite pritaikyti kintamuosius šiems algoritmams. Jei duomenys nepaverčiami tolydžiais, kai kurie algoritmai (pavyzdžiui polinominė logistinė regresija) gali užtrukti labai ilgai arba jų nebus galima įvykdyti. Ši problema itin dažna, kai dirbama su dideliais duomenų rinkiniais. Be to rezultatai gauti iš tolydžių duomenų gali būti sunkiai interpretuojami ar netinkami. Optimal Binning procedūra leidžia paversti tolydžius duomenis diskrečiais ir gauti geriausius rezultatus taikant diskretiesiems duomenims skirtus algoritmus. Optimal Binning procedūra leidžia apdoroti duomenis trimis būdais: