Რა არის "დიდი მონაცემები"?

და რატომ არის ეს დიდი საქმე?

"დიდი მონაცემები" არის ახალი მეცნიერული ცოდნა და ადამიანის ქცევის პროგნოზირება შეუძლებელი მონაცემების დიდი მოცულობის შესწავლით. დიდი მონაცემები ასევე ცნობილია როგორც "პროგნოზირებადი ანალიტიკა".

Twitter- ის შეტყობინებები, Facebook- ის გამოხმაურება, eBay ძიება, GPS ტრეკერები და ბანკომატების აპარატები რამდენიმე დიდი მონაცემების მაგალითებია. უსაფრთხოების ვიდეოების შესწავლა, სატრანსპორტო მონაცემები, ამინდის ნიმუშები, ფრენის ჩამოსვლა, მობილური ტელეფონის კოშკის ჟურნალი და გულისცემის ტრეკერები სხვა ფორმებია. დიდი მონაცემები საშინელი ახალი მეცნიერებაა, რომელიც ყოველკვირეულად ცვლის და მხოლოდ რამდენიმე ექსპერტს ესმის.

რა არის გარკვეული მაგალითები დიდი მონაცემთა რეგულარულ ცხოვრებაში?

screenshot http://project.wnyc.org/transit-time

მიუხედავად იმისა, რომ ყველაზე დიდი მონაცემთა პროექტები ძალიან ბუნდოვანია, არსებობს წარმატებული მაგალითები დიდი მონაცემები, რომლებიც გავლენას ახდენენ ფიზიკური პირების, კომპანიებისა და მთავრობების ყოველდღიურ ცხოვრებაში:

ვირუსების პროგნოზირების პროგნოზირება: სოციალურ-პოლიტიკური მონაცემების, ამინდისა და კლიმატის მონაცემების შესწავლისა და საავადმყოფო / კლინიკური მონაცემების შესწავლით, ამ მეცნიერებმა უკვე 4 კვირიანი წინასწარ გაფრთხილება მოახდინა დენგეს ცხელება.

Homicide Watch: ეს დიდი მონაცემთა პროექტი პროფილები მკვლელობის მსხვერპლი, ეჭვმიტანილი და კრიმინალები ვაშინგტონში. როგორც გარდაცვლილთა პატივისცემა და ხალხის ცნობიერების რესურსი, ეს დიდი მონაცემთა პროექტია მომხიბლავი.

ტრანზიტის სამოგზაურო დაგეგმვა, NYC: WNYC რადიომაუწყებლის სტივ მელენდესმა ონლაინ მეტროს გრაფიკი დაათვალიერა სამოგზაურო მარშრუტით. მისი შექმნის საშუალებას იძლევა ნიუ-იორკსი რუკაზე მათი ადგილმდებარეობის დასათვალიერებლად, ხოლო მატარებელთა და მეტროპოლიტენის სამგზავრო დროის პროგნოზირება გამოჩნდება.

ქსეროქსი შემცირდა მათი ძალის დაკარგვა: სატელეფონო ცენტრის მუშაობა ემოციურად ამოწურულია. Xerox- მა შეისწავლა პროფესიონალური ანალიტიკოსების დახმარებით მონაცემები და ახლა მათ შეუძლიათ პროგნოზირება, თუ რომელი სატელეფონო ცენტრის დაქირავებაა, სავარაუდოდ, დარჩება კომპანიის ყველაზე გრძელი.

კონტრტერორისტული დახმარება: სოციალური მედიის, ფინანსური ჩანაწერების, ფრენის დათქმების და უსაფრთხოების მონაცემების შესწავლით, სამართალდამცავებმა შეიძლება პროგნოზირება და ტერორისტული ეჭვმიტანილების მოძებნა, სანამ ისინი აკეთებენ ბოროტებას.

ბრენდის მარკეტინგის რეგულირება სოციალური მედიის მიმოხილვაზე : ხალხი პირდაპირ და სწრაფად იზიარებს მათ ონლაინ აზრებს პაბი, რესტორანი ან ფიტნეს კლუბზე. შესაძლებელია ამ მილიონობით სოციალური მედიის გამოკვლევის შესწავლა და კომპანიას მიაწოდოს ინფორმაცია იმის შესახებ, თუ რას ფიქრობს ხალხი მათი მომსახურებით.

ვინ იყენებს დიდ მონაცემებს? რას აკეთებენ ისინი?

ბევრი მონოლითური კორპორაციები დიდ მონაცემებს იყენებენ მომხმარებელთა კმაყოფილების მაქსიმალურად გაზრდისთვის მათი შეთავაზებისა და ფასების შესაფასებლად.

რატომ არის დიდი მონაცემები ასეთი დიდი გარიგება?

4 რამ დიდი მონაცემები მნიშვნელოვანია:

1. მონაცემები მასიურია. ეს არ შეესაბამება ერთი მყარი დისკი , გაცილებით ნაკლებია USB ჯოხი . მონაცემთა მოცულობა ბევრად აღემატება იმას, რაც ადამიანის გონებას შეუძლია განიცადოს (მილიარდი მილიარდი მეგაბაიტი დაფიქრება, შემდეგ კი მილიარდობით გაზრდის).

2. მონაცემები არის ბინძური და შეუსაბამო. დიდი მონაცემთა მუშაობის 50% დან 80% კონვერტაცია და ინფორმაციის გაწმენდაა, რომელიც საძიებო და დალაგებულია. ჩვენი პლანეტის მხოლოდ რამდენიმე ათასი ექსპერტი კარგად იცის, თუ როგორ უნდა გააკეთოს ეს მონაცემები გასუფთავება. ეს ექსპერტები ასევე საჭიროებენ სპეციალიზირებულ იარაღს, როგორიცაა HPE და Hadoop, გააკეთონ თავიანთი ბეჭდვისთვის. ალბათ 10 წლის განმავლობაში, დიდი მონაცემთა ექსპერტები გახდება dime ათეული, მაგრამ ახლა, ისინი ძალიან იშვიათი სახეობის ანალიტიკოსი და მათი მუშაობა ჯერ კიდევ ძალიან ბუნდოვანი და tedious.

3. მონაცემები გახდა სასაქონლო ნიშანი, რომელიც შეიძლება გაიყიდოს და იყიდეს. მონაცემთა ბაზარი არსებობს, სადაც კომპანიებსა და ფიზიკურ პირებს შეუძლიათ შეიძინონ სოციალური მედიის და სხვა მონაცემების თრეიბატები. მონაცემების უმრავლესობა ღრუბელია, რადგან ძალიან დიდია იმისთვის, რომ შევაჩეროთ ნებისმიერი მყარი დისკი. შესყიდვის მონაცემები ხშირად მოიცავს სააბონენტო გადასახადს, სადაც შედიხართ Cloud Server- ის ფერმაში.

** დიდი მონაცემთა ინსტრუმენტები და იდეების ლიდერები არიან Amazon, Google, Facebook და Yahoo. იმის გამო, რომ ეს კომპანიები ემსახურებიან ამდენი მილიონობით ადამიანს, მათ ონლაინ მომსახურებასთან ერთად, აზრია, რომ ისინი გახდებიან კრებული და დიდი მონაცემთა ანალიზების მიღმა მომხრეები.

4. დიდი მონაცემების შესაძლებლობები გაუთავებელია. შესაძლოა, ექიმები ერთ დღეს პროგნოზირებენ გულის შეტევებისა და პარალიზის მქონე ადამიანებს, სანამ ისინი ხდებოდა. თვითმფრინავი და საავტომობილო დამანგრეველი შეიძლება შემცირდეს მათი მექანიკური მონაცემებისა და საგზაო და ამინდის ნიმუშების პროგნოზირებადი ანალიზით. ონლაინ გაცნობის შეიძლება გაუმჯობესდა მიერ დიდი მონაცემთა პროგნოზები, რომლებიც თავსებადი პიროვნებები თქვენთვის. მუსიკოსები შეიძლება გაეცნონ რა მუსიკალურ კომპოზიციას ყველაზე სასიხარულოა სამიზნე აუდიტორიის შეცვლის გემოვნებაზე. Nutritionists შეიძლება შეძლონ პროგნოზირება, თუ რომელი კომბინაცია მაღაზიის შეძენილი საკვები ხელს შეუწყობს ან დაეხმაროს პირის ჯანმრთელობის მდგომარეობა. ზედაპირზე მხოლოდ scratched, და აღმოჩენები დიდი მონაცემები ხდება ყოველ კვირას.

დიდი მონაცემები ბინძურია

Monty Rakusen / გეტი

დიდი მონაცემები პროგნოზირებადი ანალიტიკაა: მასიური სტრუქტურული მონაცემების კონვერტაცია რაღაც საძიებო და დახარისხებად. ეს არის ბინძური და ქაოტური სივრცე, რომელიც მოითხოვს სპეციალურ ცოდნას და მოთმინებას.

მაგალითად, მონოლითური UPS მიწოდების სერვისი. პროგრამისტების UPS- ის კვლევის მონაცემები, მათი მძღოლების GPS და სმარტფონებისათვის, რათა გაანალიზდეს ყველაზე ეფექტური გზები სატრანსპორტო მოძრაობის ადაპტაციისთვის. ეს GPS და სმარტფონის მონაცემები საკმაოდ გამძლეა და ავტომატურად არ არის ანალიზისთვის მზად. ეს მონაცემები სხვადასხვა GPS და რუკაზე მონაცემთა ბაზებისგან განსხვავდება სხვადასხვა სმარტფონის აპარატურის მოწყობილობებით. UPS ანალიტიკოსები გაატარეს თვეების კონვერტაცია ყველა იმ მონაცემთა ფორმატში, რომელიც შეიძლება ადვილად ჩხრეკა და დალაგებულია. ძალისხმევა ღირს, თუმცა. დღეს, UPS გადაარჩინა მეტი 8 მილიონი gallons საწვავის რადგან ისინი დაიწყო ამ დიდი მონაცემთა ანალიტიკა.

იმის გამო, რომ დიდი მონაცემები ბინძურია და მოითხოვს იმდენად ძალისხმევას, რომ გაწმენდა და გამოყენება მოსამზადებლად, მონაცემები მეცნიერები გახდნენ მეტსახელად "მონაცემთა დამლაგებლები" ყველა საეჭვო სამუშაოსთვის. അഴി

დიდი მონაცემების მეცნიერება და პროგნოზირებადი ანალიტიკა ყოველ კვირას გაუმჯობესდა. ველით დიდ მონაცემებს 2025 წლისთვის ხელმისაწვდომი ყველასთვის ხელმისაწვდომი.

არ არის დიდი მონაცემები ინტრუზიული საფრთხე კონფიდენციალურობისთვის?

Feingersh / გეტი

დიახ, თუ ჩვენი კანონები და ინდივიდუალური კონფიდენციალურობის დაცვა არ არის ფრთხილად მართული, მაშინ დიდი მონაცემები შეიჭრება პირად კონფიდენციალობაში. როგორც ეს დგას, Google და YouTube და Facebook უკვე აკონტროლოთ თქვენი ყოველდღიური ონლაინ ჩვევები . შენი სმარტფონი და კომპიუტერული ცხოვრება ყოველდღე ტოვებს ციფრულ ნაკვალევებს და დახვეწილი კომპანიები სწავლობენ ამ ნაკვალევს.

დიდი მონაცემების ირგვლივ ვითარდება. კონფიდენციალურობის არის სახელმწიფო ყოფნა, რომ თქვენ ახლა უნდა მიიღოს პირადი პასუხისმგებლობა, რადგან თქვენ ველოდებით მას, როგორც ნაგულისხმები უფლება.

რა შეგიძლიათ გააკეთოთ თქვენი პირადი ინფორმაციის დაცვა?

ყველაზე დიდი ერთი ნაბიჯი შეგიძლიათ მიიღოთ არის cloak თქვენი ყოველდღიური ჩვევები გამოყენებით VPN ქსელის კავშირი . VPN მომსახურება თქვენს სიგნალს აანაზღაურებს ისე, რომ თქვენი იდენტურობა და ადგილმდებარეობა მაინც მიკვლეულია ტრეკერებისგან. ეს არ გახდის თქვენ 100% ანონიმურ, მაგრამ VPN მნიშვნელოვნად შეამცირებს რამდენად მსოფლიოს შეუძლია დაიცვას თქვენი ონლაინ ჩვევები.

სად შემიძლია გავიგო მეტი დიდი მონაცემები?

Monty Raskusen / გეტი

დიდი მონაცემები არის მომხიბლავი რამ ხალხის ანალიტიკური გონება და სიყვარული ტექნიკური. თუ ეს თქვენ, მაშინ აუცილებლად ეწვევა ამ გვერდზე საინტერესო დიდი მონაცემთა პროექტები.