Რა არის k- ნიშნავს კლასტერული?

მონაცემების მოპოვება k- საშუალებით ალგორითმით

K- ნიშნავს კლასტერული ალგორითმი არის მონაცემთა სამთო და მექანიკური ხელსაწყო ინსტრუმენტი, რომელიც გამოიყენება კასეტური დაკვირვებების ჯგუფებთან დაკავშირებულ მოსაზრებებს შორის ურთიერთობების წინასწარი ცოდნის გარეშე. შერჩევისას, ალგორითმი ცდილობს აჩვენოს, რომელი კატეგორიაში ან კასეტურში, მონაცემები ეკუთვნის, კასეტების რაოდენობას, რომელსაც განსაზღვრავს ღირებულება კ.

K- ნიშნავს ალგორითმი ერთ-ერთი ყველაზე მარტივი კლასტერული მეთოდია და იგი ხშირად გამოიყენება სამედიცინო სურათების, ბიომეტრიკასა და მასთან დაკავშირებულ სფეროებში. K- საშუალებების კომპიტერის უპირატესობა ის არის, რომ იგი მოგვითხრობს თქვენს მონაცემებს (მისი დაუზუსტებელი ფორმის გამოყენებით), ვიდრე თქვენ მიერ დაწყებული მონაცემების ალკოჰირების შესახებ ინსტრუქცია (ალგორითმის ზედამხედველობითი ფორმის გამოყენებით).

ეს ზოგჯერ უწოდებენ ლოიდის ალგორითმს, განსაკუთრებით კომპიუტერულ მეცნიერებათა წრეებში, რადგან სტანდარტული ალგორითმი პირველად 1957 წელს სტიუარტ ლოიდის მიერ იქნა შემოთავაზებული. ტერმინი "k- საშუალებები" 1967 წელს ჯეიმს მაკკენის მიერ იქნა გამოყენებული.

როგორ k- ნიშნავს ალგორითმის ფუნქციები

K- ნიშნავს ალგორითმი არის ევოლუციური ალგორითმი, რომელიც იღებს თავის სახელს ოპერაციის მეთოდისგან. ალგორითმის კლასტერების დაკვირვება k ჯგუფებში, სადაც k არის შეყვანილი პარამეტრი. მას შემდეგ აძლევს თითოეულ დაკვირვებას კასეტურებს, რომლებიც ეფუძნება დაკვირვების სიახლოვეს კასრზე. კასეტური აზრი ჯერ კიდევ ხელახლა ჩაიწერება და პროცესი კვლავ იწყება. აი, როგორ მუშაობს ალგორითმი:

  1. ალგორითმი თვითნებურად ირჩევს k პუნქტებს, როგორც თავდაპირველი კასეტური ცენტრები (საშუალებები).
  2. მონაცემთა გადაცემის თითოეულ წერტილს ენიჭება დახურულ კასეტურს, რომელიც ეფუძნება თითოეულ წერტილსა და თითოეულ კასკურ ცენტრს შორის.
  3. თითოეული კასეტური ცენტრი ამ კასეტების საშუალო რაოდენობაა.
  4. ნაბიჯები 2 და 3 განმეორებითი სანამ მტევანი გადავიდეს. კონვერგენცია შეიძლება განისაზღვროს სხვაგვარად, რაც დამოკიდებულია განხორციელების პროცესში, მაგრამ ეს ჩვეულებრივ ნიშნავს იმას, რომ არც შეინიშნება ცვლილებები კლასტერების მიერ, როდესაც 2 და 3 ნაბიჯები განმეორდება, ან ცვლილებები არ ქმნის მატერიალურ განსხვავებას კლასტერების განმარტებაში.

შერჩევა ხმების კლასტერები

ერთი მთავარი უარყოფითი მხარეები k- ნიშნავს კლასტერული არის ის ფაქტი, რომ თქვენ უნდა მიუთითოთ რაოდენობის მტევანი, როგორც შეყვანის ალგორითმი. როგორც შემუშავებულია, ალგორითმი არ არის საკმარისი რაოდენობის კლასტერების განსაზღვრა და დამოკიდებულია მომხმარებელს წინასწარ განსაზღვრა.

მაგალითად, თუ გქონდათ ადამიანების ჯგუფი, რომლებიც უნდა იყვნენ კლასიფიცირებული ბინადურ გენდერული იდენტობის საფუძველზე, როგორც მამრობითი ან ქალი, k- საშუალების ალგორითმის გამოძახება k = 3- ის გამოყენებით, აიძულებს ხალხს სამი მტევანი, როდესაც მხოლოდ ორი ან შეყვანის k = 2, უზრუნველყოფს უფრო ბუნებრივი მორგებული.

ანალოგიურად, თუ ინდივიდების ჯგუფი ადვილად ეყრდნობოდა სახლის მდგომარეობას და ვგულისხმობ k- ნიშნავს ალგორითმს შეყვანის k = 20-თან, შედეგი შეიძლება იყოს უფრო განზოგადებული ეფექტური.

ამ მიზეზით, ეს ხშირად კარგი იდეაა იმისათვის, რომ ექსპერიმენტი k- ის განსხვავებულ ღირებულებებს განსაზღვროს იმ ღირებულების იდენტიფიკაციისთვის, რომელიც საუკეთესოდ შეესაბამება თქვენს მონაცემებს. თქვენ ასევე შეგიძლიათ შეისწავლოთ სხვა მონაცემების სამთო ალგორითმების გამოყენება მანქანაში შემუშავებული ცოდნის ძიებაში.