Big Data 3 Vs

Video: Big Data 3 Vs - koncepcijas un modeļi

Video: Day 6: Linux GUI Applications are coming to Windows - YouTube 2024, Aprīlis

2024 Autors: Geoffrey Carr | [email protected]. Pēdējoreiz modificēts: 2023-12-17 10:58

Termins "dati" mums nav jauns. Tā ir viena no galvenajām lietām, ko māca, izvēloties informācijas tehnoloģiju un datorus. Ja jūs varat atcerēties, dati tiek uzskatīti par neapstrādātu informācijas formu. Lai gan jau gadu desmitā tas ir termins Lielie dati ir buzz šajās dienās. Kā redzams no termina, datu slodze un slodze ir lielie dati, un to var apstrādāt dažādos veidos, izmantojot dažādas metodes un instrumentus, lai iegūtu nepieciešamo informāciju. Šajā rakstā ir runāts par lielo datu jēdzieniem, izmantojot 3 V, ko min Doug Laney, pionieris datu noliktavu jomā, kas tiek uzskatīts par iniciatīvu Informātika (Informācijas ekonomika).

Pirms turpināt, iespējams, vēlēsieties izlasīt mūsu rakstus par lielo datu pamatiem un lielo datu izmantošanu, lai saprastu būtību. Tie varētu pievienot šo amatu, lai iegūtu plašāku informāciju par Big Data koncepcijām.

Dati milzīgā veidā, kas uzkrāti dažādos veidos, agrāk tika pareizi iesniegti dažādās datubāzēs un pēc kāda laika tiek izmesti. Kad jēdziens parādījās, ka jo vairāk datu, jo vieglāk ir atrast - atšķirīgu un atbilstošu informāciju - izmantojot pareizos rīkus, uzņēmumi sāka uzglabāt datus ilgākiem periodiem. Tas ir, piemēram, jaunu datu glabāšanas ierīču pievienošana vai mākoņa izmantošana, lai uzglabātu datus neatkarīgi no tā, kādā veidā tika iegūti dati: dokumenti, izklājlapas, datu bāzes un HTML, utt. Pēc tam tie tiek sakārtoti pareizos formātos, izmantojot rīkus, kas spēj apstrādāt milzīgas Dati

PIEZĪME: Lielo datu apjoms neaprobežojas ar datiem, kurus apkopojat un uzglabājat savās telpās un mākoņos. Tas var ietvert datus no dažādiem citiem avotiem, tostarp, bet ne tikai, publiskajā domēnā esošiem vienumiem.

Big Data 3D modelis pamatojas uz sekojošiem V:

Apjoms: attiecas uz datu glabāšanas pārvaldību
Ātrums: attiecas uz datu apstrādes ātrumu
Šķirne: attiecas uz dažādu, šķietami nesaistītu datu kopu grupēšanas datiem

Turpmākajos punktos tiek izskaidrots Big Data modelēšana, detalizēti runājot par katru dimensiju (katrs V).

A] Lielo datu apjoms

Runājot par lielajiem datiem, var saprast apjomu kā milzīgu neapstrādātas informācijas kolekciju. Lai gan tas ir taisnība, tas attiecas arī uz datu glabāšanas izmaksām. Svarīgus datus var uzglabāt gan telpās, gan mākoņos, pēdējais ir elastīgs risinājums. Bet vai jums ir jāuzglabā katrs un viss?

Saskaņā ar "Meta Group" publicēto informatīvo materiālu, kad datu apjoms palielinās, datu daĜas sākas nevajadzīgas. Turklāt tā norāda, ka jāsaglabā tikai tāds datu apjoms, ko uzņēmumi plāno izmantot. Citi dati var tikt noraidīti vai uzņēmumi, kas nevēlas atteikties no "šķietami nenozīmīgiem datiem", tos var pārdot par neizmantotajām datoru ierīcēm un pat uz lentēm, lai uzņēmumiem nebūtu jāmaksā par šādu datu glabāšanu.

Es izmantoju "šķietami nenozīmīgus datus", jo es arī uzskatu, ka jebkura veida datus var pieprasīt jebkurš uzņēmums agrāk vai vēlāk, un tādēļ tas ir jāuzglabā pietiekami ilgu laiku, pirms jūs zināt, ka dati patiešām ir nav svarīgi. Personīgi es vecākos datus dumpu uz cietajiem diskiem no pagātnes un dažreiz uz DVD. Galvenie datori un mākoņa krātuve satur datus, kurus es uzskatu par būtiskiem un uzzinu, ka es tos izmantošu. Starp šiem datiem tiek izmantoti arī viena veida dati, kas pēc vecāku cieto disku beigām var rasties pēc dažiem gadiem. Iepriekš minētais piemērs ir tikai jūsu izpratnei. Tas neatbilst Big Data aprakstam, jo summa ir diezgan mazāka salīdzinājumā ar to, ko uzņēmumi uztver kā Big Data.

B ] Ātrums lielos datos

Datu apstrādes ātrums ir svarīgs faktors, runājot par Big Data koncepcijām. Ir daudz vietņu, īpaši e-komercijas. Google jau bija atzinis, ka ātrums, kādā lapas ielāde ir nepieciešama, lai iegūtu labākus vērtējumus. Neatkarīgi no klasifikācijām, ātrums arī nodrošina komfortu lietotājiem, kamēr viņi iepērkas. Tas pats attiecas uz datiem, kas tiek apstrādāti citai informācijai.

Runājot par ātrumu, ir svarīgi zināt, ka tas pārsniedz augstāku joslas platumu. Tas apvieno viegli lietojamus datus ar dažādiem analīzes rīkiem. Viegli lietojami dati nozīmē dažus mājasdarbus, lai izveidotu viegli strukturētu datu struktūru. Nākamā dimensija - "šķirne", tālāk izplatoties uz to.

C] Lielo datu šķirne

Ja ir slodzes un daudz datu, ir svarīgi tos organizēt tā, lai analīzes rīki varētu viegli apstrādāt datus. Ir arī rīki datu organizēšanai. Uzglabājot, dati var būt nestrukturēti un jebkādā veidā. Jums ir jāizprot, kādas attiecības tas ir ar citiem jūsu datiem. Kad būsiet sapratuši saistību, varēsiet uzņemt atbilstošus rīkus un pārveidot datus uz vēlamo veidlapu, lai izveidotu strukturētu un sakārtotu uzglabāšanu.

Kopsavilkums

Citiem vārdiem sakot, Big Data 3D modelis ir balstīts uz trīs dimensijām: USBLE dati, kas jums pieder; pareiza datu marķēšana; un ātrāka apstrāde. Ja šie trīs tiek rūpināti, jūsu datus var viegli apstrādāt vai analizēt, lai noskaidrotu visu, ko vēlaties.

Iepriekš paskaidroti abi jēdzieni un lielo datu 3D modelis. Otrajā paragrāfā iekļautie raksti būs papildu atbalsts, ja esat jaunais jēdziens.

Ja vēlaties kaut ko pievienot, lūdzu, komentējiet.

Ieteicams:

Kā pievienot Tilt-Shift efektu, lai padarītu jūsu fotogrāfijas izskatās mazie modeļi Photoshop

Slīpuma pārslēgšanas efekts ir dīvaina optiskā ilūzija, kur regulāra fotogrāfija izskatās kā rotaļlietas modeļa foto. Radoši sajaucot dažādas attēla daļas, jūs vilina cilvēku acis, interpretējot visu, kas tajā ir ļoti mazs.

Kā tīrīt un atjaunot lietotajā modelī M klaviatūru

Cienījamais M modelis, kuru IBM 1980. gados pirmo reizi ražoja (un pēc tam licencējusi un pārdeva citiem uzņēmumiem), bauda tukša telpa tastatūras entuziastu sirdīs un prātos. Tās salīdzinoši vienkāršais, bet izturīgais spiediena atsperes slēdža mehānisms ir burtiski pārbaudījis laiku: daudzas sākotnējās ražošanas ietvaru tastatūras joprojām darbojas un tiek izmantotas tiem, kas mīl vecmodīgas konstrukcijas un sajūt.