Przetwarzanie danych

Przetwarzanie danych (ang. data processing) – przekształcanie treści i postaci danych wejściowych (ang. input) metodą wykonywania systematycznych operacji w celu uzyskania wyników (ang. output) w postaci z góry określonej. Wyróżnia się przetwarzanie numeryczne (stosunkowo skomplikowane algorytmy i niewielkie ilości danych) oraz systemowe (stosunkowo proste algorytmy i duże ilości danych).

Wydajność oprogramowania wyraża ilość pracy wykonanej w określonym przedziale czasu. Im więcej pracy program wykona w jednostce czasu, tym większa jest jego wydajność. Uściślając, wydajność programu jest mierzona liczbą jednostek danych wejściowych (rozmiarem danych), którymi w danym czasie program ten zarządza w celu przekształceniu ich na jednostki wyjściowe (dane).

Strumieniowa baza danych to baza danych, w której dane są przedstawione w postaci zbioru strumieni danych. System zarządzania taką bazą nazywany jest strumieniowym systemem zarządzania danymi (DSMS - ang. Data Stream Management System).

Abstrakcyjny typ danych (ang. Abstract data type - ADT) jest to tworzenie i opisywanie w formalny sposób typów danych tak, że opisywane są jedynie własności danych i operacji wykonywanych na nich (a nie przez reprezentację danych i implementację operacji).

PHP Data Objects – rozszerzenie języka PHP udostępniające jednolity interfejs baz danych w postaci pojedynczej klasy z metodami wspólnymi dla różnych silników zarządzania bazą danych. Eliminuje to konieczność korzystania przez twórców oprogramowania z własnych lub zewnętrznych rozwiązań unifikujących sposób operowania na bazie danych.

Strumieniowa baza danych to baza danych, w której dane są przedstawione w postaci zbioru strumieni danych. System zarządzania taką bazą nazywany jest strumieniowym systemem zarządzania danymi (DSMS - ang. Data Stream Management System).

Dane binarne (ang. binary data) — dane zapisane w postaci dwójkowej, tzn. reprezentowane jako ciąg zer i jedynek. Dane zapisane binarnie zajmują mniej miejsca niż dane zapisane alfanumerycznie. Możliwe jest też znacznie wydajniejsze przetwarzanie tak zapisanych danych, gdyż nie istnieje konieczność tłumaczenia odczytywanych danych z postaci alfanumerycznej na binarną i odwrotnie. Dane zapisane binarnie nie są czytelne dla człowieka bez stosowania specjalizowanych narzędzi umożliwiających ich zinterpretowanie.

Normalizacja bazy danych jest to proces mający na celu eliminację powtarzających się danych w relacyjnej bazie danych. Główna idea polega na trzymaniu danych w jednym miejscu, a w razie potrzeby linkowania do danych. Taki sposób tworzenia bazy danych zwiększa bezpieczeństwo danych i zmniejsza ryzyko powstania niespójności (w szczególności problemów anomalii).

PHP Data Objects – rozszerzenie języka PHP udostępniające jednolity interfejs baz danych w postaci pojedynczej klasy z metodami wspólnymi dla różnych silników zarządzania bazą danych. Eliminuje to konieczność korzystania przez twórców oprogramowania z własnych lub zewnętrznych rozwiązań unifikujących sposób operowania na bazie danych.

Przestrzenna baza danych (ang. spatial database) - jest bazą danych zoptymalizowaną do składowania i odpytywania danych powiązanych z obiektami w przestrzeni, takimi jak: punkty, linie i wielokąty. Tradycyjne bazy danych mogą przyjmować dane w postaci liczbowej i znakowej, natomiast do przetwarzania przestrzennych typów danych potrzebują dodatkowej funkcjonalności. Open Geospatial Consortium stworzył specyfikację i zbiór standardów dodawania przestrzennych funkcjonalności do systemów bazodanowych.

Transaction Processing Performance Council (TPC) jest organizacją typu non-profit założoną w 1985 w celu zdefiniowania testów wydajnościowych w dziedzinie przetwarzania danych. Organizacja ta publikuje wyniki testów, które dzięki dobrze zdefiniowanej metodyce są uważane za obiektywne i weryfikowalne. Wyniki testów TPC są powszechnie stosowane dla porównywania wydajności systemów przetwarzania danych. Specyficzną cechą tych testów jest podawanie wyników, nie tylko w ilości transakcji w jednostce czasu, ale też obliczanie kosztu pojedynczych transakcji bazując na cenie katalogowej użytego systemu. Testy wydajnościowe TPC są stale rozwijane by uzyskać wyniki w sytuacjach zbliżonych do tych, w jakich pracują systemy podczas komercyjnego stosowania przez organizacje zajmujące się przetwarzaniem danych. Stąd na przykład wprowadzenie testów w podziale według kategorii "wielkość bazy danych", gdy eksperci stwierdzili, że liczba rekordów w bazie danych może istotnie wpływać na uzyskiwane wyniki wydajnościowe.

Przetwarzanie danych osobowych to termin prawny, który w prawie polskim został zdefiniowany w ustawie dnia 29 sierpnia 1997 roku o ochronie danych osobowych (t.j. Dz.U. z 2002 r. Nr 101, poz. 926 ze zm.) (ustawodawca posłużył się określeniem przetwarzanie danych). Przetwarzanie oznacza jakiekolwiek operacje wykonywane na danych osobowych, takie jak zbieranie, utrwalanie, przechowywanie, opracowywanie, zmienianie, udostępnianie i usuwanie, a zwłaszcza te, które wykonuje się w systemach informatycznych.

Denormalizacja bazy jest to wprowadzenie kontrolowanej nadmierności do bazy danych w celu przyśpieszenia wykonywania na niej operacji (np. obsługiwania zapytań); dzięki denormalizacji bazy unika się kosztownych operacji połączeń tabel.

Administrator bezpieczeństwa informacji (ABI) – termin prawniczy, który w prawie polskim został zdefiniowany w ustawie z dnia 29 sierpnia 1997 roku o ochronie danych osobowych. Oznacza osobę nadzorująca z upoważnienia administratora danych osobowych przestrzeganie stosowania środków technicznych i organizacyjnych zapewniających ochronę przetwarzanych danych osobowych w sposób odpowiedni do zagrożeń oraz kategorii danych objętych ochroną.

Przetwarzanie danych georadarowych jest to szereg metod cyfrowego przetwarzania sygnałów stosowanych w celu eliminacji szumu, wzmocnienia sygnału i uporządkowania w przestrzni zarejestrowanych wydarzeń. W jej wyniku uzyskuje się możliwie czysty i pozbawiony zniekształceń obraz budowy podłoża terenu lub innych obiektów (np. ścian) na podstawie danych georadarowych. Wiele z podanych tu metod jest także stosowanych w przetwarzaniu danych w sejsmice refleksyjnej.

Denormalizacja bazy jest to wprowadzenie kontrolowanej nadmierności do bazy danych w celu przyśpieszenia wykonywania na niej operacji (np. obsługiwania zapytań); dzięki denormalizacji bazy unika się kosztownych operacji połączeń tabel.

MVCC (ang. "Multiversion Concurrency Control"), mechanizm kontroli współbieżności. Ogólna koncepcja wykorzystywana w różnej formie przez wiele współczesnych systemów baz danych, sprowadzająca się do umożliwienia jednoczesnego dostępu oraz wykonywania operacji na tych samych danych wielu odbiorcom.

Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych w niej danych. Temporalne bazy danych są często administrowane automatycznie, poprzez usuwanie nieaktualnych danych lub ich archiwizowanie.

Dekonwolucja w matematyce oznacza proces odwrotny do splotu funkcji zarejestrowanych danych. Technika dekonwolucji, czyli odplatania stosowana jest powszechnie w cyfrowym przetwarzanie sygnałów i jest odwrotna do splotu sygnałów. Ogólnie polega ona na określeniu funkcji opisującej zakłócenia (np. szum o charakterze funkcji harmonicznej) w celu ich odfiltrowania od zarejestrowanych danych i uzyskania niezakłóconych danych (np. uzyskanie ostrego obrazu z zamazanego zdjęcia).

Cyfrowe przetwarzanie sygnałów (CPS; ang. Digital Signal Processing, DSP) - dziedzina nauki i techniki zajmująca się sygnałami w postaci cyfrowej i metodami przetwarzania takich sygnałów. Cyfrowe przetwarzanie sygnałów i analogowe przetwarzanie sygnałów są gałęziami nadrzędnej dyscypliny: przetwarzania sygnałów. W ramach CPS wskazać można takie obszary jak: cyfrowe przetwarzanie dźwięku, cyfrowe przetwarzanie obrazów oraz przetwarzanie mowy.

Amazon Simple Storage Service (Amazon S3) - internetowy nośnik danych firmy Amazon, posiada prosty w obsłudze interfejs WWW, który umożliwia dostęp do przechowywanych danych i zarządzanie nimi. Ilość przechowywanych danych jest praktycznie nielimitowana. Jakość i skalowalność infrastruktury Amazon S3 jest taka sama jak ta używana przez firmę Amazon do udostępniania i zarządzania własną, globalną siecią stron internetowych.



       na podstawie Wikipedii, otwartej encyklopedii : licencje: GFDL, oraz CC-BY-SA 3.0 + autorzy, historia
edycja