SQream DB - Brza analiza velikih skupova podataka

Modernizacijom poslovanja, u skladu s trenutačnim tehnološkim zahtjevima svjetskog tržišta, brzina obrade velike količine digitalnih podataka ulazi u fokus svake tvrtke

Vedran Podubski, Megatrend poslovna rješenja utorak, 1. listopada 2019. u 00:00

Interna arhitektura SQream DB baze

Vedran Podubski, konzultant za poslovna rješenja, Megatrend poslovna rješenja

Podaci se obrađuju u svakoj industriji i oni čine dio svakodnevnog poslovanja, neovisno o primarnoj djelatnosti tvrtke. Uporabom i obradom podataka iz raznih izvora – iz skladišta podataka, iz raznih oblika samostalnih datoteka (Excel, Open Office), IoT podataka (Internet Of Things), računovodstvenih softvera s vlastitim bazama podataka, itd. – količina informacija koje treba analizirati eksponencijalno se povećava, a sama brzina njihove obrade pada. “Tradicionalne” baze podataka postaju izvor sve većih troškova, zbog spore obrade i nužne dodatne optimizacije informacija te zbog stalnih ulaganja u hardver i ljudske potencijale.

Sva ta dodatna ulaganja, kako vremena tako i materijalnih resursa, izvode se u svrhu “popravka” performansi baza podataka. Tradicionalne RDBMS baze (Oracle, MS SQL Server, itd.), koje se koriste kao skladišta za analizu podataka, obrađuju informacije u procesoru, u realnom vremenu, čitajući i pišući podatke na diskove serijski. Zbog takvog načina funkcioniranja – kad rade s većom količinom podataka i kad se suoče s većom kompleksnošću upita koji se izvršavaju – tradicionalnim bazama podataka padaju performanse.

Kako se to ne bi dogodilo, stalno treba ulagati u brže diskove, nove procesore i procesorske jezgre, u više radne memorije, itd. – kako bi se kompenzirala vremenska komponenta obrade. Uz to, svaka nadogradnja hardvera i seljenje podataka na nove servere, dovodi do zastoja u radu samog skladišta podataka.

SQream DB

Izvođenje analitičkih operacija nad skupom digitalnih informacija unutar tvrtke – bilo u svrhu analize povijesnih podataka poslovanja, nadzora poslovanja ili planiranja budućnosti, bilo u automatiziranim procesima ili od tima analitičara – ne bi smjelo biti točki zagušenja. Stoga se mnoge tvrtke okreću suvremenim rješenjima, točnije, bazama podataka napravljenima baš u svrhu ubrzavanja analitičkih operacija u velikim skupovima podataka. Za potrebe obrade i skladištenja velike količine podatka, točnije za veliki promet podataka na tjednoj i mjesečnoj razini, možemo preporučiti vrlo brzu bazu podataka – SQream DB.

Riječ je o suvremenoj RDBMS bazi, primarno zamišljenoj za skladištenje velike količine podataka (Big Data), bržoj jer za obradu podataka, umjesto običnih, koristi grafičke procesore (GPU). Prva inačica te baze predstavljena je još 2014. godine u Silicijskoj dolini. Cilj je bio napraviti rješenje koje će ubrzati analizu velikih skupova podataka uz pomoć višejezgrenih procesora Nvidijinih grafičkih kartica, paralelnim izvršavanjem upita nad bazom. Rješenje SQream DB napravljeno je iznova – točnije, u njegovu dizajnu nije korišten nijedan postojeći sustav kao temelj za razvoj, primjerice Hadoop ili Postgres. Izvršavanje upita na grafičkim procesorima tehnologija je koja je vrlo slična sustavima korištenima za rudarenje podataka kod kriptovaluta te omogućuje masivnu paralelnu obradu podataka na svakoj jezgri procesora grafičke kartice.

To postiže koristeći višu frekvenciju grafičke memorije, koja je mnogo brža od uobičajene RAM memorije na matičnoj ploči. U standardnim, često korištenim skladištima podataka sve komponente unutar sustava usko su povezane i zajednički koriste hardverske resurse, što kod velikog protoka podataka i velikog broja korisnika otežava skaliranje i stvara probleme s performansama. SQream DB taj problem rješava inteligentnom internom arhitekturom koristeći odvojeni kompajler, izvršni dio i spremnik podataka, kako bi bolje optimizirao protok podataka i njihovu obradu.

Dva načina particioniranja

Sljedeći korak ubrzanja performansi unutar SQream DB baze postiže se particioniranjem podataka. To se izvodi na dva načina. Prvo je hiper particioniranje i namijenjeno je većoj kompresiji podataka i ubrzavanju njihova protoka te se izvršava potpuno automatski. Taj dio particioniranja je vertikalni, točnije kolumnarni, i omogućuje selektivni pristup određenim podskupovima kolumni u bazi, čime se smanjuje potreba za čestim pisanjem/čitanjem podataka s diskova.

Ta vrsta particioniranja savršena je za paraleliziranu obradu podataka, primjerice, preko grafičkog procesora. Drugi dio particioniranja je horizontalan. Izvodi se podjelom podataka na komade manjih opsega (engl. chunks and extents). Horizontalna podjela podataka na manje podskupove omogućuje bolju iskorištenost hardvera i relativno male količine GRAM-a (RAM na grafičkoj kartici), što se postiže spajanjem podataka (engl. spooling) i inteligentnim korištenjem predmemorije (cache).

Ekosustav

SQream DB može raditi na većini standardnog serverskog x86 – 64 hardvera s Nvidijinim grafičkim karticama, pa čak i na komercijalnim laptopima opremljenim takvim hardverom, no za najbolji radni učinak preporučuju se 2x grafičke kartice Nvidia Tesla (K80, P40, P100 itd.), a za još veće ubrzanje IBM-ovi procesori POWER9 na kojima se performanse podižu i do 3,7 puta, prema testiranjima. Na nezavisnim testiranjima performansi Sqream DB baze, u sustavu mobilnog operatera, pri “probavljanju” 1,6 TB podataka tjedno, performanse u usporedbi s konkurentskom bazom podataka (Greenplum), pokazuju od 5 do 18 puta veću brzinu, uključujući unos i kompresiju podataka i brzinu izvršavanja upita. Baza je dostupna u obliku softvera koji se može instalirati na standardnu x86 – 64 ili IBM-ovu POWER9 arhitekturu s Nvidijinim grafičkim karticama, kao servis u cloudu (Amazon P2 / P3 with NVIDIA Tesla, Azure NCv3 with Tesla V100) i IBM-ove Bluemix bare-metal sustave. Za dodatne informacije i stručne savjete oko SQream DB baza i/ili IBM-ova POWER9 sustava slobodno se obratite našim stručnjacima na poslovna.rjesenja@megatrend.com.

Metapodaci i načini zapisivanja

Standardne data warehouse baze podataka koriste isključivo procesorske jezgre i RAM memoriju za obradu, upisivanje i dohvaćanje podataka. Kod SQream DB baze taj proces je proširen i na inteligentno korištenje kombinacije dostupnih resursa procesora, RAM memorije i grafičkih procesora. Primjerice, interni sustav u bazi automatski koristi centralni procesor (CPU) ako bi kopiranje podatka u grafički procesor (GPU) uzelo previše vremena i usporilo upit/obradu. Tako se postiže mnogo brža obrada podataka. Još jedan revolucionarni pristup spremanju podataka kod SQream DB-a je i inteligentno korištenje metapodataka generiranih obradom preko grafičkih procesora.

Metapodaci sadrže opisne podatke o opsegu (engl. range) i vrijednosti svakog skupa podataka (engl. chunks), te su spremljeni zasebno od stvarnih podataka, čime se omogućuje inteligentno preskakanje nepotrebnih opsega podataka prilikom izvršenih upita. Tako se stvaraju tzv. zonske mape, što za rezultat ima smanjenje uporabe hardverskih resursa. Uz to, SQream DB je potpuno ANSI – 92 SQL kompatibilna i lako se implementira u sve informatičke ekosustave jer ima ugrađenu podršku za sve tipične ODBC i JDBC konektore, uključujući i Python, C#, .NET, C++, Java i druge. Izvorna podrška za SQL jezik omogućuje korištenje bilo kojeg ETL alata i ostalih aplikacija nad bazom, čime se smanjuje vrijeme implementacije na minimum. Prema mjerenjima iz prakse, količina “probavljenih” podataka (naravno, u ovisnosti od hardvera) može biti i do 3,5 TB na sat, iz raznih izvora, te se može implementirati kao sloj između Apache Kafke i Apache Sparka te služi kao sloj za analitiku između to dvoje.

NAPOMENA: Ovaj tekst je izvorno objavljen u časopisu Mreža.

https://mreza.bug.hr/casopis/listopad-2019/240

Vezano

📢 Provjeri

LINKS Office O122I

559,99€ Kupi

📢 Istraži!

Samsung poklanja

Već od 619,99

Kupi

📢 Istraži!

AMAZFIT ZenBuds

89,99€ Kupi

Posjetite našu Hi-Fi slušaonicu.

Ronis Velesajam

Rezervirajte termin u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

24-bitni DAC i snažni DSP

Novo u ponudi

BOWERS & WILKINS Zeppelin Pro Edition

Bowers & Wilkins Zeppelin Pro Edition aktivni zvucnik, 24-bitni DAC i snažan DSP, Apple AirPlay 2, Bluetooth aptX™, Spotify Connect, Bowers & Wilkins Music app, 5 pogonskih jedinica, Titanijum Dome tweeter.

799 € Kupi

Peta generacija legendarnog Debut gramofona.

PRO-JECT Debut PRO B gramofon

Gramofon s pogonom na remen, elektronička kontrola brzine 33/45 RPM, aluminijski tanjur s TPE prigušivanjem, 8,6” jednodijelna karbonska ručica, minimalna izobličenja, signal-šum 68 dB.

699 € ~~699 €~~ Kupi

HDI™ valovod nove generacije.

JBL Stage2 250B zvučnici

Bookshelf zvučnici, 5.25” polucelulozni rebrasti woofer, 1” anodizirani aluminijski visokotonac, HDI™ waveguide, snaga pojačala 20-150W, frekvencijski raspon 50Hz-25kHz, osjetljivost 86dB, impedancija 6 Ohm

499 € Kupi

Senzorni bas i personalizirani zvuk.

Akcija

SKULLCANDY Crusher Evo Wireless

Crusher Evo bežicne over-ear, Skullcandy aplikacija, baterija od 40 sati + brzo punjenje, kontrola poziva, glasnica i audio zapisa, ugradena tehologija pronalaska slušalica, mogu se ravno saviti i skopiti

149 € ~~178,69 €~~ Kupi

NaglašenijI niskI tonovI.

Akcija

PRO-JECT T1 (OM5e) gramofon

Gramofon s pogonom na remen, ručna promjena brzine 33/45 RPM, varijacija brzine 0.7% (33) / 0.6% (45), wow & flutter 0.25% (33) / 0.23% (45), 8mm stakleni tanjur s filcanom podlogom, signal-šum 65dB, 8.6” aluminijska ručica, efektivna duljina 218.5 mm, overhang 22.0 mm, masa ručice 8.0 g

368 € Akcija

Tehnologija temeljena na modelu SL1200G.

TECHNICS SL-1300G Grand Class gramofon

Direktni pogon, Brushless DC motor, Brzine: 33-1/3, 45, 78 rpm, Wow & Flutter: 0.025%, Pladanj: Aluminijum, mesing, guma, 3.6 kg, Tonearm: Statička ravnoteža, dužina 230 mm, Podesiva visina: 0-6 mm, Pritisak igle: 0-4g, Kompatibilne zvučnice: 5.6-12g (do 28.5g sa težinom), PHONO izlaz

2.999 € Kupi

Za one koji neumoljivo teže najboljem zvuku.

YAMAHA R-N1000A receiver

Trosmjerni fllorstander, frekvencijski odziv 32Hz-30kHz (-6dB), impedancija 4 ohma, osjetljivost 92dB, snaga opterecenja 200W

1.589 € Kupi

Napredna Metamaterial apsorpcijska tehnologija.

KEF Q Concerto Meta zvučnici

Uni-Q 3-way bass reflex zvučnici. Frekvencijski raspon 40 Hz - 20 kHz, s tipičnim basom do 36 Hz. Osjetljivost 85 dB, maksimalna izlazna snaga 108 dB, a minimalna impedancija 3.2Ω. Preporučeno pojačalo 15 - 180 W.

1.199 € Kupi

Novosti iz naše Hi-Fi slušaonice

Novosti

Isprobali smo KEF Q Concerto Meta

Q Concerto Meta smo slušali s nekoliko pojačala koja za njih predstavljaju logičan izbor ili barem logičan početak traženja - Audiolab 7000A, Arcam A15, NAD C368 i Cambridge Audio CXA81 MkII.

Kupi