Apakah Tepatnya 'Data Besar'?

Dan Kenapa Ia Berjaya?

'Data besar' adalah sains baru yang memahami dan meramalkan tingkah laku manusia dengan mengkaji jumlah besar data tidak berstruktur. Data besar juga dikenali sebagai 'analisis ramalan'.

Menganalisis jawatan Twitter, suapan Facebook, carian eBay, pelacak GPS, dan mesin ATM adalah beberapa contoh data besar. Mengkaji video keselamatan, data trafik, corak cuaca, ketibaan penerbangan, log menara telefon bimbit, dan pelacak kadar denyutan jantung adalah bentuk lain. Data besar adalah ilmu sains baru yang berubah setiap minggu, dan hanya beberapa ahli memahami semuanya.

Apakah Beberapa Contoh Data Besar dalam Kehidupan Biasa?

screenshot http://project.wnyc.org/transit-time

Walaupun kebanyakan projek data besar tidak jelas, terdapat contoh besar data besar yang mempengaruhi kehidupan seharian individu, syarikat, dan kerajaan:

Prediksi wabak virus: dengan mengkaji data sosio-politik, cuaca dan iklim, dan data hospital / klinikal, saintis kini meramalkan wabak demam denggi dengan notis terlebih dahulu 4 minggu.

Homicide Watch: profil data data besar ini membunuh mangsa, suspek, dan penjenayah di Washington, DC. Kedua-duanya sebagai cara untuk menghormati almarhum dan sebagai sumber kesadaran untuk orang, projek data besar ini menarik.

Perancangan Perjalanan Transit, NYC: Programmer radio WNYC Steve Melendez menggabungkan jadual kereta bawah tanah dalam talian dengan perisian perjalanan perjalanan. Penciptaannya membolehkan New Yorkers mengklik lokasi mereka di peta, dan ramalan masa perjalanan untuk kereta api dan kereta bawah tanah akan muncul.

Xerox mengurangkan kehilangan tenaga kerja mereka: kerja pusat panggilan adalah meletihkan emosi. Xerox telah mengkaji reams data dengan bantuan penganalisis profesional, dan kini mereka dapat meramalkan panggilan pusat panggilan mana yang mungkin akan kekal dengan syarikat yang paling lama.

Menyokong kaunter keganasan: dengan mengkaji media sosial, rekod kewangan, tempahan penerbangan, dan data keselamatan, penguatkuasa undang-undang boleh meramalkan dan mencari suspek pengganas sebelum melakukan perbuatan jahat mereka.

Meluruskan pemasaran jenama berdasarkan tinjauan media sosial : orang dengan jujur ​​dan cepat berkongsi pemikiran dalam talian mereka di pub, restoran, atau kelab kecergasan. Ada kemungkinan untuk mengkaji berjuta-juta jawatan media sosial ini dan memberi maklum balas kepada syarikat mengenai apa yang orang fikirkan mengenai perkhidmatan mereka.

Siapa yang Menggunakan Data Besar? Apa yang mereka lakukan dengannya?

Banyak syarikat monolitik menggunakan data besar untuk menyesuaikan tawaran dan harga mereka untuk memaksimumkan kepuasan pelanggan.

Mengapa Data Big Seperti Tawaran Besar?

4 perkara membuat data besar penting:

1. Data adalah besar-besaran. Ia tidak akan sesuai dengan pemacu keras tunggal , lebih kurang batang USB . Jumlah data jauh melebihi apa yang dapat dilihat oleh minda manusia (memikirkan satu bilion bilion megabait, dan kemudian membiak dengan lebih banyak berbilion).

2. Data adalah kemas dan tidak berstruktur. 50% hingga 80% daripada kerja data besar adalah menukar dan membersihkan maklumat supaya dapat dicari dan disusun. Hanya beberapa ribu ahli di planet kita mengetahui sepenuhnya bagaimana melakukan pembersihan data ini. Pakar-pakar ini juga memerlukan alat yang sangat khusus, seperti HPE dan Hadoop, untuk melakukan kerajinan mereka. Mungkin dalam tempoh 10 tahun, pakar data besar akan menjadi sedozen, tetapi sekarang, mereka adalah spesies penganalisis yang sangat jarang dan kerja mereka masih sangat tidak jelas dan membosankan.

3. Data telah menjadi komoditi ** yang boleh dijual dan dibeli. Pasar data wujud di mana syarikat dan individu boleh membeli terabyte media sosial dan data lain. Kebanyakan data berasaskan awan, kerana ia terlalu besar untuk disesuaikan dengan mana-mana cakera keras tunggal. Membeli data biasanya melibatkan yuran langganan di mana anda memasuki ladang pelayan awan.

** Para pemimpin alat dan idea data yang besar adalah Amazon, Google, Facebook, dan Yahoo. Kerana syarikat-syarikat ini berkhidmat dengan berjuta-juta orang dengan perkhidmatan dalam talian mereka, ia masuk akal bahawa mereka akan menjadi titik pengumpulan dan penglihatan di balik analisis data besar.

4. Kemungkinan data besar tidak berkesudahan. Mungkin doktor akan meramalkan serangan jantung dan sebatan untuk satu minggu sebelum mereka berlaku. Pesawat dan kemalangan kereta mungkin dikurangkan dengan analisis ramalan data mekanik dan corak cuaca dan cuaca. Kencan dalam talian mungkin diperbaiki dengan membuat peramal data besar tentang siapa yang sesuai untuk anda. Para pemuzik mungkin mendapat gambaran mengenai komposisi muzik apa yang paling menarik kepada selera penonton sasaran. Pakar pemakanan mungkin dapat meramalkan kombinasi makanan yang dibeli di kedai akan memburukkan atau membantu keadaan perubatan seseorang. Permukaan hanya tercalar, dan penemuan dalam data besar berlaku setiap minggu.

Data Besar Adakah Messy

Monty Rakusen / Getty

Data besar adalah analitik ramalan: penukaran data tidak berstruktur secara besar-besaran menjadi sesuatu yang boleh dicari dan disusun. Ini adalah ruang yang kemas dan huru-hara yang memerlukan pengetahuan dan kesabaran yang istimewa.

Ambil contoh perkhidmatan penghantaran UPS monolitik. Pengaturcara di data kajian UPS dari GPS dan telefon pintar pemandu mereka untuk menganalisis cara yang paling berkesan untuk menyesuaikan diri dengan kesesakan lalu lintas. Data GPS dan telefon pintar ini sangat besar, dan tidak secara automatik bersedia untuk dianalisis. Data ini menumpukan dari pelbagai pangkalan data GPS dan peta, melalui peranti perkakasan telefon pintar yang berbeza. Penganalisis UPS telah menghabiskan masa berbulan-bulan menukarkan semua data itu ke dalam format yang boleh dengan mudah dicari dan disusun. Bagaimanapun, usahanya adalah berbaloi. Hari ini, UPS telah menyelamatkan lebih daripada 8 juta gelen bahan api sejak mereka mula menggunakan analisis data besar ini.

Oleh kerana data besar tidak kemas dan memerlukan banyak usaha untuk membersihkan dan mempersiapkan penggunaan, para saintis data telah dijuluki sebagai 'penjaga data' untuk semua kerja yang membosankan. Gg

Sains data besar dan analisis ramalan meningkat setiap minggu, walaupun. Mengharapkan data besar untuk menjadi mudah diakses oleh semua orang menjelang tahun 2025.

Adakah Big Data Ancaman Antrusif untuk Privasi?

Feingersh / Getty

Ya, jika undang-undang kami dan pertahanan privasi individu tidak diuruskan dengan teliti, maka data besar memasuki privasi peribadi. Oleh kerana itu, Google dan YouTube dan Facebook sudah mengesan tabiat dalam talian harian anda . Hayat telefon pintar dan pengkomputeran anda meninggalkan jejak kaki digital setiap hari, dan syarikat-syarikat yang canggih sedang mempelajari tapak kaki mereka.

Undang-undang di sekitar data besar sedang berkembang. Privasi adalah keadaan yang perlu anda ambil tanggungjawab peribadi untuk, kerana anda tidak boleh mengharapkan ia sebagai hak lalai.

Apa yang anda boleh lakukan untuk melindungi privasi anda:

Langkah tunggal terbesar yang anda boleh lakukan ialah menjamu tabiat harian anda menggunakan sambungan rangkaian VPN . Perkhidmatan VPN akan merancangkan isyarat anda supaya identiti dan lokasi anda sekurang-kurangnya terlindung dari penjejak. Ini tidak akan menjadikan anda 100% anonim, tetapi VPN akan secara substansial mengurangkan berapa banyak dunia dapat memerhatikan tabiat dalam talian anda.

Di manakah saya boleh mengetahui lebih lanjut mengenai data besar?

Monty Raskusen / Getty

Data besar adalah sesuatu yang menarik untuk orang yang mempunyai minda analitik dan cinta untuk teknologi. Jika itu anda, maka pasti melawat halaman projek data besar yang menarik ini.