How to discover stolen data using Hadoop and Big data?

Data theft has been a big issue for quite some time. What adds to the problem is the long time taken to identify the theft. The longer it takes to detect data theft, the more difficult it is to find a solution. Hadoop and Big Data can help organizations reduce the time to identify data theft and find a solution. A few organizations, as this article will show in due course, have been using Hadoop and Big Data to detect data theft quickly. Still, workable data theft solutions have just started to come and there is still a long time before we are able to develop sound defenses against data theft.

Data theft: some scary statistics

jenama terkenal di seluruh dunia telah mengalami kerugian besar reputasi dan wang kerana kecurian data. Pertimbangkan statistik berikut:

  • In the US, over 8 years, a hacking group targeted banks, departmental stores and payment processors and stole more than 160 million credit and debit card numbers.
  • KT Corp, the Korean mobile carrier suffered a huge loss of reputation when two suspects reportedly earned more than $850,000 by selling the plan details and contact information of more than 8.7 million KT subscribers.
  • Experian, one of the biggest data monitoring companies in the world, disclosed a huge breach of data of customers who had applied for services at T-Mobile. The data included names, addresses, Social Security Numbers, passport details and driving license details.
  • JP Morgan Chase suffered a loss of more than 76000000 rekod pelanggan apabila penggodam mencuri nombor akaun pelanggan, nama dan ID e-mel. Apa yang menambah kepada masalah ini adalah bahawa kecurian itu dikesan hampir sebulan kemudian.
  • Home Depot mengalami kerugian besar data sensitif apabila butiran kad kredit sehingga 56 juta pelanggan telah dicuri daripada sistem daftar tunai. pelanggaran ini telah dilakukan oleh malware yang dipasang oleh penggodam Rusia dan Ukraine dalam sistem daftar tunai.

Terdapat banyak lagi kejadian seperti ini berlaku setiap hari. Pemerhatian berikut boleh disimpulkan daripada sampel di atas:

  • kecurian data boleh melanggar paling kuat sistem kerana metodologi kecurian data yang berkembang dengan kaedah kecurian anti-data.
  • kecurian data tidak boleh dihapuskan tetapi ia boleh diuruskan dengan lebih baik.
  • Jika sistem jenama terkenal seperti seperti JP Morgan dan Chase dan Experian boleh dilanggar, kemudian hampir tidak ada yang selamat.
  • sistem perlindungan kecurian data perlu dimensi yang lain dan tidak hanya tertumpu kepada melindungi data. For example, terdapat keperluan untuk mengenal pasti dengan cepat kecurian data dan mengenal pasti tapak kaki.

Peranan Hadoop dan Big Data memulihkan data dicuri

Ia tidak mungkin untuk menghapuskan kecurian data dan ia boleh menyerang bila-bila masa mana-mana sahaja. Tetapi pendekatan ke arah kecurian data memerlukan pengubahsuaian. Walaupun sistem keselamatan data ditingkatkan, pengesanan kecurian awal dan memulihkan kehilangan data juga perlu mendapat perhatian. Hadoop dan Big Data boleh memainkan peranan dalam dengan cepat mengenal pasti insiden kecurian data. Beberapa syarikat telah bekerja pada mencari penyelesaian kecurian data. Mereka tidak cuba untuk mengelakkan kecurian data - yang tidak mungkin. Mereka bekerja di kedua-dua perkara-perkara berikut:

  • Mengenal pasti kecurian data secepat mungkin supaya data dapat dikesan tanpa membuang masa.
  • Penjejakan data dicuri di Internet dan Web Gelap.

Konsep di sebalik penyelesaian kecurian data

Andaian di belakang penyelesaian kecurian data adalah bahawa ia adalah hampir mustahil untuk menghentikan kecurian data. Cara terbaik untuk mendekati keadaan kecurian data adalah dengan menganggap bahawa ia tidak dapat dielakkan dan dengan cepat mula mencari data sebelum ia hilang.

Terdapat perbezaan asas antara kejadian mencuri yang baik yang nyata dan data. Tidak seperti yang baik yang nyata, pencuri data hanya boleh mencuri salinan data. Data asal boleh membantu mengesan salinan dalam web. Ia adalah kira-kira membandingkan asal dan salinan yang.

Untuk dipadankan dengan asal dan salinan yang, anda perlu menjana kod hash yang asal dan sepadan dengan yang salinan. Satu kod hash adalah nombor unik atau pengenalan yang diberikan kepada sebahagian data. Teknik untuk menjana kod hash ini dikenali sebagai hashing kriptografi. Menurut pakar-pakar dalam bidang ini, syarikat perisikan data yang mengkhusus dalam penyelesaian kecurian data, "" Ia bukan kod yang tertanam dalam data begitu banyak sebagai pengiraan dilakukan ke atas data itu sendiri ". Anda perlu terlebih dahulu membahagikan data kepada beberapa ketulan dan kemudian berjalan setiap ketulan melalui fungsi matematik untuk menjana kod hash. Selepas itu, anda merangkak web dan sepadan dengan kod hash dengan data yang terdapat di web. Jika kod hash asal perlawanan dengan itu apa-apa data lain, anda telah menemui data dicuri.

Beberapa syarikat juga menyeru seluruh Matching proses cap jari yang. Kod hash ketulan data yang dikenali sebagai cap jari data dan tindakan yang hampir sama kod hash dipanggil pemadanan cap jari.

Penyelesaian kecurian data agak kuat kerana mereka dapat merangkak walaupun Web Gelap mana laman web boleh menyembunyikan identiti mereka. In fact, merangkak Gelap Web yang dituntut sebagai salah satu ciri utama penyelesaian kecurian data.

Beberapa penyelesaian kecurian data juga menawarkan analisis dan keupayaan pelaporan untuk pelanggan mereka. Penyelesaian-penyelesaian ini boleh disepadukan dengan hampir mana-mana maklumat keselamatan dan pengurusan acara (SIEM) sistem. The Siems boleh menerima isyarat.

Berikut adalah gambar rajah aliran kerja biasa untuk aplikasi keselamatan standard.

Flow diagram

gambar rajah aliran

Peranan Hadoop dan Data Besar dalam mencari data yang dicuri

Jelas sekali, untuk dipadankan cap jari data, Matchlight perlu mengendalikan satu jumlah yang besar data.

Seluruh proses memecahkan data menjadi ketulan dan menjana kod hash melibatkan jumlah besar data. Ia adalah dibayangkan bahawa pangkalan data bagi setiap syarikat pengurusan data kecurian mesti penuh dengan data. Memproses seperti sejumlah besar data, syarikat-syarikat perlu platform Hadoop yang boleh dipercayai. Tidak apa-apa penyelesaian Hadoop akan melakukan. Ia perlu menjadi sesuatu yang seperti versi perusahaan gred Hadoop yang dilaksanakan dalam kod asli dan tidak pada Mesin Java Maya. Ini menjadikan Hadoop lebih sumber yang cekap.

Penyelesaian kecurian data di pasaran benar-benar bergantung kepada ketulan data atau set data. Semakin dataset, yang lebih tinggi adalah peluang untuk dipadankan cap jari. So, terdapat keperluan sistem yang boleh mengendalikan jumlah data yang besar. Hanya Hadoop dan Data Besar mampu melakukan yang. Menurut Danny Rogers, "Kami hanya sebagai baik sebagai data yang kami kumpulkan, dan keupayaan kita untuk mengumpul lebih banyak data bergantung kepada sekeping utama teknologi ini. "

Peranan atas Hadoop dalam mencari data yang dicuri boleh menetapkan templat untuk mengesan data yang dicuri. Anda perlu besar-besaran dan automasi berasaskan awan dengan pengagihan perusahaan gred untuk mengetahui data yang dicuri. Hadoop memainkan dua peranan dalam konteks ini: pengurus dataset dan pemproses dataset. Bagi mana-mana organisasi yang cuba untuk dipadankan cap jari dataset untuk mencari data yang dicuri, ia akan mempunyai untuk menyimpan dan memproses jumlah besar dataset. Untuk itu, ia akan memerlukan pengurusan data bunyi dan sistem pemprosesan.

Summary

Pembangunan sistem pengesanan kecurian data mewakili perubahan dalam pendekatan ke arah kecurian data dalam erti kata yang. Ia adalah baik bahawa perusahaan menyedari potensi Hadoop dalam mengesan data yang dicuri. Hadoop melengkapi sistem pengesanan kecurian data. teknik cap jari yang hampir sama perlu disokong oleh penyimpanan data yang mencukupi dan keupayaan pemprosesan. However, seperti yang dinyatakan sebelum ini dalam artikel ini, ini adalah hari-hari awal dalam perkembangan seperti ini. perspektif lain boleh memastikan keselamatan sistem penyimpanan data yang boleh menjadi sasaran untuk serangan masa depan kerana sistem ini menyimpan sejumlah besar data. Dalam kes sedemikian, pangkalan data perusahaan dan Hadoop boleh sama-sama menghadapi serangan dari Hacker.

============================================= ============================================== Buy best TechAlpine Books on Amazon
============================================== ---------------------------------------------------------------- electrician ct chestnutelectric
error

Enjoy this blog? Please spread the word :)

Follow by Email
LinkedIn
LinkedIn
Share