|
Az SPSS adatbányász szoftverének 11.0-ás verziója igen bőséges új funkciókészlettel rendelkezik.
Automatikus
modell kiválasztás és összehasonlítás. A Binary Classifiers node
lehetővé teszi kétértékű (igen/nem, lemorzsolódik/marad stb.)
változókat előrejelző modellek létrehozását és összehasonlítását
neurális háló, döntési fák (C5.0, CART, QUEST, CHAID), és logisztikus
regresszió algoritmusok segítségével. Ki lehet választani a használni
kívánt algoritmusokkat, az algoritmusokhoz tartozó opciókat és azt a
mérőszámot, amellyel össze szeretnénk hasonlítani az előállított
modelleket.
Idősoros elemzés és forecast-olás exponential
smoothing és ARIMA modellek alapján. Meghatározhatók egyedileg a
paraméterek, vagy az Expert Modeler-re is rábízható, hogy melyik az
idősorra legjobban illeszkedő modell. A Time Intervals és Time Plot
node-ok is továbbfejlesztésre kerültek, támogatják a jövő-értékeket, a
forecast-okat és más modellezési funkciókat.
Az új
Decision List algoritmus olyan listát állít elő, amely egy elvárt
outputot jobban vagy kevésbé valószínűsítő szabályokat állít elő. A
szabályok sorrendben futnak le és az első érvényes szabály minősíti az
esetet. A Decision List modellek széles körben elterjedtek a CRM, call
center és marketing alkalmazások terén. A Clementine-ban előállított
Decision List modellek az SPSS következő verzióiban is felhasználhatók
lesznek.
A Clementine 11.0 képes importálni és score-ozni
PMML 3.1 modeleket (Clementineból vagy SPSS 15-ből generált
transzformációs modelleket.)
Frissítésre került a C5.0
algoritmus, amely kategorikus mezők használatakor (Set vagy Ordered
Set) nagyobb valószínűséggel helyezi egymás mellé a kategóriákat, amely
így általában kisebb fákat eredményez.
A Logisztikus
Regresszió node kiegészítésre került binomiális modellezési opcióval
(két diszkrét értékű célváltozó modellezése).
Data Audit
node bővítések. A továbbfejlesztett Data Audit node egyetlen riportba
kombinálja az adat vizualizáció, alap statisztikák, hiányzó és kiugró
értékek együttesét, lehetővé téve az adatok egyetlen lépésben történő
elsődleges tanulmányozását. (Ez a node tartalmazza a korábbi Quality
node funkcióit.)
Missing value imputation. A Data Audit
node lehetővé teszi hiányzó értékek helyettesítését, egy több szabályt
és algorimust kipróbáló audit lefuttatása után.
Kiugró
értékek interaktív szűrése. Számos modellezési technikát megzavarnak az
extrém kiugró értékek. A kiugró értékek lehetnek egy- vagy
többváltozósak, amelynek egyszerű kiszűrésével, vagy az értékeik
megváltoztatásával sok időt takaríthatnak meg az elemzők. A Transform
output node lehetővé teszi transzformációk kiválasztását, majd Derive
Node vagy Filler Node generálását, amely elvégzi a transzformációkat a
kiválasztott mezőkre.
A Binning node kibővült az optimális
és a felügyelt csoportosítás funkciókkal. Ha egy mező, amelyet
csoportosítani akarunk, erősen kötődik egy másik kategorikus mezőhöz,
akkor a kategorikus mező kiválasztható "supervisor"-nak, így a
csoportosítás után az eredeti kapcsolat erőssége megőrződik.
SPSS
Transform node. Ha rendelkezik SPSS-szel is, az SPSS Transform node
lehetővé teszi SPSS syntax futtatását a Clementine-on belül. A Syntax
közvetlenül bemásolható az SPSS-ből a Clementine-ba, így nem kell az
alkalmazások között adatállományokat mozgatni. Ez lehetővé teszi
egyetlen lépésben több mező származtatását ciklusok segítségével, több
node vagy supernode alkalmazása nélkül. (Ez a node kevésbé interaktív,
mint a Clementine Transform node, de többlet rugalmasságot biztosít az
SPSS felhasználók számára)
SPSS Modeling Nodes. Új Discriminant és GENLIN node-ok bővítik az elemzési modell készletet.
SPSS
Output node. Ha rendelkezik SPSS-szel is, az SPSS Output node-dá
továbbfejlesztett SPSS Procedure node lehetővé teszi SPSS syntax
parancsok futtatását és az eredmény Clementine-ban történő
felhasználását. (Ez a node korábban az SPSS-t indította el). A
továbbfejlesztett változat lehetővé teszi statisztikák, táblázatok és
multi-dimenzionális táblák generálását a TABLES parancs segítségével.
Sokat fejlődtek, jobban prezentálhatóak és személyre szabhatóak lettek az üzleti grafikák is.
Az
adatbázisban történő modellezés újabb algorimusokkal bővült (Oracle
Data Miner, IBM DB2 Intelligent Miner, Microsoft Analysis Services
2005).
Lényegesen nőtt az adatbiztonság: SSL titkosítású
adatkapcsolat a szerverrel, jelszavas védelem lehetősége node-okra,
stream-ekre, státuszokra, vagy projektekre.
Új lehetőség
az alkalmazás-generálás, amely olyan SQL vagy más kód generálását
jelenti, amelyet egy operációs rendszer vagy adatbáziskezelő Clementine
nélkül is képes futtatni.
Nőtt a teljesítmény. A
Clementine Server képes párhuzamosan futtatni multi-terminal node
stream-eket - ez kiemelten hasznos a riportok és outputok elosztott
előállításánál - és gyorsabb lett a Clementine kliens is.
Akiket érdekelne Béta tesztelési lehetőség, kérjük, keressék meg a Képviseletet!
|