STATISTICA Text Miner
STATISTICA Text Miner e опционална функционалност към STATISTICA Data Miner, подходяща за транслация на неструктуриран текст в значима стойностна информация.
Повечето потребители запознати с data mining знаят, че реалните данни идват в разнообразни формати които реално не са организирани и готови за анализ. STATISTICA Text Miner „копае” в неструктурирана информация организирана в нетрадиционни структури на данни.
Как може да използваме STATISTICA Text Miner ?
- Анлизиране на съдържанието в WEB страници. Например, потребителите могат автоматинчо да обработя и обобщят всички WEB страници и съобщения в текстов формат свързани с дадена компния .
- Включване на неструктурирани съобщения в data mining проект. Например, потребителите могат да включат «отврени» отговри от анкети или описание на симптоми в data mining проект с цел създаване на клъстери.
- Анализ на голям обем от документи. Например, потребители могат да анализират складове от документи като формуляри за застрахователни претенции, с цел подобна информация да се включи в проект по улавяне на измами.
STATISTICA Text Miner е специално разработен като отворена архитектура за анализ на неструктурирана информация. По нататъшна екстракция/ селекция и други аналитични средства налице в STATISTICA Text Miner са приложими не само за текстови документи и WEB страници, но също за индексации, класифициране и клъстеризация на неструктурирана информация като картинки ( bitmap) и т.н.