Kezdőoldal
Már béta verzióban a Clementine 11
Már béta verzióban a Clementine 11

Az SPSS adatbányász szoftverének 11.0-ás verziója igen bőséges új funkciókészlettel rendelkezik.

Automatikus modell kiválasztás és összehasonlítás. A Binary Classifiers node lehetővé teszi kétértékű (igen/nem, lemorzsolódik/marad stb.) változókat előrejelző modellek létrehozását és összehasonlítását neurális háló, döntési fák (C5.0, CART, QUEST, CHAID), és logisztikus regresszió algoritmusok segítségével. Ki lehet választani a használni kívánt algoritmusokkat, az algoritmusokhoz tartozó opciókat és azt a mérőszámot, amellyel össze szeretnénk hasonlítani az előállított modelleket.

Idősoros elemzés és forecast-olás exponential smoothing és ARIMA modellek alapján. Meghatározhatók egyedileg a paraméterek, vagy az Expert Modeler-re is rábízható, hogy melyik az idősorra legjobban illeszkedő modell. A Time Intervals és Time Plot node-ok is továbbfejlesztésre kerültek, támogatják a jövő-értékeket, a forecast-okat és más modellezési funkciókat.

Az új Decision List algoritmus olyan listát állít elő, amely egy elvárt outputot jobban vagy kevésbé valószínűsítő szabályokat állít elő. A szabályok sorrendben futnak le és az első érvényes szabály minősíti az esetet. A Decision List modellek széles körben elterjedtek a CRM, call center és marketing alkalmazások terén. A Clementine-ban előállított Decision List modellek az SPSS következő verzióiban is felhasználhatók lesznek.

A Clementine 11.0 képes importálni és score-ozni PMML 3.1 modeleket (Clementineból vagy SPSS 15-ből generált transzformációs modelleket.)

Frissítésre került a C5.0 algoritmus, amely kategorikus mezők használatakor (Set vagy Ordered Set) nagyobb valószínűséggel helyezi egymás mellé a kategóriákat, amely így általában kisebb fákat eredményez.

A Logisztikus Regresszió node kiegészítésre került binomiális modellezési opcióval (két diszkrét értékű célváltozó modellezése).

Data Audit node bővítések. A továbbfejlesztett Data Audit node egyetlen riportba kombinálja az adat vizualizáció, alap statisztikák, hiányzó és kiugró értékek együttesét, lehetővé téve az adatok egyetlen lépésben történő elsődleges tanulmányozását. (Ez a node tartalmazza a korábbi Quality node funkcióit.)

Missing value imputation. A Data Audit node lehetővé teszi hiányzó értékek helyettesítését, egy több szabályt és algorimust kipróbáló audit lefuttatása után.

Kiugró értékek interaktív szűrése. Számos modellezési technikát megzavarnak az extrém kiugró értékek. A kiugró értékek lehetnek egy- vagy többváltozósak, amelynek egyszerű kiszűrésével, vagy az értékeik megváltoztatásával sok időt takaríthatnak meg az elemzők. A Transform output node lehetővé teszi transzformációk kiválasztását, majd Derive Node vagy Filler Node generálását, amely elvégzi a transzformációkat a kiválasztott mezőkre.

A Binning node kibővült az optimális és a felügyelt csoportosítás funkciókkal. Ha egy mező, amelyet csoportosítani akarunk, erősen kötődik egy másik kategorikus mezőhöz, akkor a kategorikus mező kiválasztható "supervisor"-nak, így a csoportosítás után az eredeti kapcsolat erőssége megőrződik.

SPSS Transform node. Ha rendelkezik SPSS-szel is, az SPSS Transform node lehetővé teszi SPSS syntax futtatását a Clementine-on belül. A Syntax közvetlenül bemásolható az SPSS-ből a Clementine-ba, így nem kell az alkalmazások között adatállományokat mozgatni. Ez lehetővé teszi egyetlen lépésben több mező származtatását ciklusok segítségével, több node vagy supernode alkalmazása nélkül. (Ez a node kevésbé interaktív, mint a Clementine Transform node, de többlet rugalmasságot biztosít az SPSS felhasználók számára)

SPSS Modeling Nodes. Új Discriminant és GENLIN node-ok bővítik az elemzési modell készletet.

SPSS Output node. Ha rendelkezik SPSS-szel is, az SPSS Output node-dá továbbfejlesztett SPSS Procedure node lehetővé teszi SPSS syntax parancsok futtatását és az eredmény Clementine-ban történő felhasználását. (Ez a node korábban az SPSS-t indította el). A továbbfejlesztett változat lehetővé teszi statisztikák, táblázatok és multi-dimenzionális táblák generálását a TABLES parancs segítségével.

Sokat fejlődtek, jobban prezentálhatóak és személyre szabhatóak lettek az üzleti grafikák is.

Az adatbázisban történő modellezés újabb algorimusokkal bővült (Oracle Data Miner, IBM DB2 Intelligent Miner, Microsoft Analysis Services 2005).

Lényegesen nőtt az adatbiztonság: SSL titkosítású adatkapcsolat a szerverrel, jelszavas védelem lehetősége node-okra, stream-ekre, státuszokra, vagy projektekre.

Új lehetőség az alkalmazás-generálás, amely olyan SQL vagy más kód generálását jelenti, amelyet egy operációs rendszer vagy adatbáziskezelő Clementine nélkül is képes futtatni.

Nőtt a teljesítmény. A Clementine Server képes párhuzamosan futtatni multi-terminal node stream-eket - ez kiemelten hasznos a riportok és outputok elosztott előállításánál - és gyorsabb lett a Clementine kliens is.

Akiket érdekelne Béta tesztelési lehetőség, kérjük, keressék meg a Képviseletet!