Analiza danych

Analiza danych – proces przetwarzania danych w celu uzyskania na ich podstawie użytecznych informacji i wniosków. W zależności od rodzaju danych i stawianych problemów, może to oznaczać użycie metod statystycznych, eksploracyjnych i innych.

Text mining – ogólna nazwa metod eksploracji danych służących do wydobywania danych statystycznych z tekstu i ich późniejszej obróbki. Metody text mining stosowane są np. do statystycznego przetwarzania:

Normalizacja bazy danych jest to proces mający na celu eliminację powtarzających się danych w relacyjnej bazie danych. Główna idea polega na trzymaniu danych w jednym miejscu, a w razie potrzeby linkowania do danych. Taki sposób tworzenia bazy danych zwiększa bezpieczeństwo danych i zmniejsza ryzyko powstania niespójności (w szczególności problemów anomalii).

Przetwarzanie danych georadarowych jest to szereg metod cyfrowego przetwarzania sygnałów stosowanych w celu eliminacji szumu, wzmocnienia sygnału i uporządkowania w przestrzni zarejestrowanych wydarzeń. W jej wyniku uzyskuje się możliwie czysty i pozbawiony zniekształceń obraz budowy podłoża terenu lub innych obiektów (np. ścian) na podstawie danych georadarowych. Wiele z podanych tu metod jest także stosowanych w przetwarzaniu danych w sejsmice refleksyjnej.

Carrot2 jest otwartym systemem do przetwarzania danych tekstowych, w szczególności stosowany jest do grupowania rezultatów wyszukiwania danych w wyszukiwarkach internetowych, choć może być użyty również do innych typów danych i zastosowań.

Chemometria - dział chemii zajmujący się wykorzystaniem metod komputerowych, statystycznych, matematycznych oraz symbolicznych w analizowaniu danych chemicznych. Metody chemometryczne mogą również służyć do analizy danych: fizycznych, medycznych i wszelkich innych. Chemometrię stosuje się do projektowania lub wyboru optymalnych procedur eksperymentalnych, aby pozyskać maksimum informacji poprzez analizę danych a także w celu nabywania wiedzy u układach (systemach) chemicznych i nie tylko chemicznych.

Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych uzyskanych podczas badania statystycznego. Celem stosowania metod statystyki opisowej jest podsumowanie zbioru danych i wyciągnięcie pewnych podstawowych wniosków i uogólnień na temat zbioru.

Imputacja - w statystyce sztuczne wstawienie pewnych wartości do tabeli danych. Na ogół imputacja jest wykonywana w celu usunięcia tzw. braków danych, czyli wartości nieznanych. Wiele metod statystycznych nie akceptuje bowiem obserwacji z brakami danych.

Archiwizacja (ang. backup) to proces wykonywania kopii danych w celu zabezpieczenia ich przed utratą, wskutek wystąpienia takich zdarzeń losowych jak: powódź, pożar, włamanie, awaria sprzętu lub oprogramowania, czy skasowanie ich przez użytkownika. Pod pojęciem archiwizacji rozumie się również proces przenoszenia danych z systemów komputerowych na inne nośniki w celu zredukowania ilości danych, np. już niepotrzebnych w głównym systemie komputerowym (bazie danych).

Imputacja - w statystyce sztuczne wstawienie pewnych wartości do tabeli danych. Na ogół imputacja jest wykonywana w celu usunięcia tzw. braków danych, czyli wartości nieznanych. Wiele metod statystycznych nie akceptuje bowiem obserwacji z brakami danych.

System informacji marketingowych ( SIM ) - przez system informacji marketingowych, rozumie się sformalizowany i powiązany wewnętrznie zespół osób, urządzeń oraz procedur stworzonych w celu zapewnienia uporządkowanego dopływu trafnych informacji ze źródeł wewnętrznych i zewnętrznych na potrzeby podejmowania decyzji marketingowych. To metoda ciągłego planowania, zbierania i przechowywania oraz analizy danych. System informacji marketingowej ułatwia podejmowanie dwóch kategorii decyzji: programowanych i nieprogramowanych. SIM powinien być okresowo weryfikowany w celu oceny wartości dostarczonych informacji i sformułowania zapotrzebowania na nowe informacje. Wyniki badań marketingowych i informacje uzyskane z systemu informacji marketingowej są względem siebie komplementarne. Ze względu na potrzebę sprawnego przetwarzania dużej liczby danych, SIM funkcjonuje zazwyczaj przy wykorzystaniu techniki komputerowej.

Archiwizacja (ang. backup) to proces wykonywania kopii danych w celu zabezpieczenia ich przed utratą, wskutek wystąpienia takich zdarzeń losowych jak: powódź, pożar, włamanie, awaria sprzętu lub oprogramowania, czy skasowanie ich przez użytkownika. Pod pojęciem archiwizacji rozumie się również proces przenoszenia danych z systemów komputerowych na inne nośniki w celu zredukowania ilości danych, np. już niepotrzebnych w głównym systemie komputerowym (bazie danych).

Przestrzenna baza danych (ang. spatial database) - jest bazą danych zoptymalizowaną do składowania i odpytywania danych powiązanych z obiektami w przestrzeni, takimi jak: punkty, linie i wielokąty. Tradycyjne bazy danych mogą przyjmować dane w postaci liczbowej i znakowej, natomiast do przetwarzania przestrzennych typów danych potrzebują dodatkowej funkcjonalności. Open Geospatial Consortium stworzył specyfikację i zbiór standardów dodawania przestrzennych funkcjonalności do systemów bazodanowych.

Kartotekowa baza danych (lub prosta baza danych) - baza danych złożona z jednej lub kilku tablic zawierających rekordy, z których każdy zawiera identyczną strukturę pól. Każda tablica danych jest samodzielnym dokumentem i nie może współpracować z innymi tablicami, w przeciwieństwie do relacyjnej bazy danych.

Metaanaliza – pojęcie z zakresu analizy danych, określające wtórne odkrywanie wiedzy metodą uogólniania informacji zawartych w publikacjach czy źródłach pierwotnych.

System Informacji Przestrzennej – zawiera proces pozyskiwania, przetwarzania i udostępniania danych dotyczących obiektów o charakterze przestrzennym. Termin stosowany zamiennie z określeniem GIS.

Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych w niej danych. Temporalne bazy danych są często administrowane automatycznie, poprzez usuwanie nieaktualnych danych lub ich archiwizowanie.

Rozproszona baza danych - baza danych istniejąca fizycznie na dwóch lub większej liczbie komputerów, traktowana jednak jak jedna logiczna całość, dzięki czemu zmiany w zawartości bazy w jednym komputerze są uwzględniane również w innych maszynach. Rozproszone bazy danych są stosowane ze względu na zwiększoną wydajność przetwarzania na wielu komputerach jednocześnie.

Import danych (ang. import of data) – proces pobierania danych z innych aplikacji do przetwarzającego je programu, wymagający niekiedy zmiany ich formatu (konwersji).

SWING (Standard Wymiany INformacji Geodezyjnych) - format danych geodezyjnych służący do wymiany danych pomiędzy bazami danych systemów informatycznych SIT. Pozwala na reprezentację w pliku tekstowym obiektów przestrzennych i opisowych.

Operacja StartTLS ustanawia szyfrowanie TLS w połączeniu sieciowym. Zapewnia to poufność danych (zabezpieczenie przed możliwością odczytania danych przez osoby trzecie) oraz ochronę integralności danych (zabezpieczenie danych przed ich modyfikacją). Podczas negocjacji szyfrowania TLS serwer wysyła swój certyfikat X.509, aby potwierdzić swoją tożsamość. Klient może także przesłać swój certyfikat w celu potwierdzenia swojej tożsamości. Następnie klient może wysłać SASL/EXTERNAL. Użycie SASL/EXTERNAL oznacza, że klient żąda, aby serwer ustalił swoją tożsamość na podstawie poświadczeń dostarczonych na niższym poziomie (np. TLS). Z technicznego punktu widzenia serwer może użyć informacji o tożsamości ustanowionych na dowolnym niższym poziomie, jednak zazwyczaj serwer użyje tożsamości ustanowionej przez warstwę TLS.

Przetwarzanie danych (ang. data processing) – przekształcanie treści i postaci danych wejściowych (ang. input) metodą wykonywania systematycznych operacji w celu uzyskania wyników (ang. output) w postaci z góry określonej. Wyróżnia się przetwarzanie numeryczne (stosunkowo skomplikowane algorytmy i niewielkie ilości danych) oraz systemowe (stosunkowo proste algorytmy i duże ilości danych).



       na podstawie Wikipedii, otwartej encyklopedii : licencje: GFDL, oraz CC-BY-SA 3.0 + autorzy, historia
edycja