Რეგესიის სტატისტიკური მოდელის განსაზღვრა

რეგრესია ანალიზი ურთიერთობების შორის ცვლადები

რეგრესია არის მონაცემთა სამთო ტექნიკა, რომელიც გამოიყენება რიცხვითი ღირებულებების (ასევე უწოდებენ უწყვეტი მნიშვნელობების ) პროგნოზირებისთვის. მაგალითად, რეგრესია შეიძლება გამოყენებულ იქნას პროდუქტის ან მომსახურების ღირებულების პროგნოზირება, სხვა ცვლადების გათვალისწინებით.

რეგრესია გამოიყენება სხვადასხვა ინდუსტრიებში სხვადასხვა ბიზნესისა და მარკეტინგის დაგეგმვის, ფინანსური პროგნოზის, გარემოსდაცვითი მოდელირებისა და ტენდენციების ანალიზისთვის.

რეგრესია Vs. კლასიფიკაცია

რეგრესია და კლასიფიკაციაა მონაცემთა სამთო ტექნიკა, რომლებიც გამოიყენება მსგავსი პრობლემების გადასაჭრელად, მაგრამ ხშირად ხდება დაბნეული. ორივე გამოყენებულია პროგნოზირების ანალიზში, მაგრამ რეგრესია გამოიყენება რიცხვითი ან უწყვეტი მნიშვნელობის პროგნოზირებისას, ხოლო კლასიფიკაცია ანიჭებს მონაცემებს დისკრეტული კატეგორიებად.

მაგალითად, რეგრესია გამოყენებული იქნებოდა სახლის ღირებულების პროგნოზირება მისი ადგილმდებარეობის მიხედვით, კვადრატული ფუტი, ფასი, ბოლო გაყიდვები, მსგავსი ტიპის სახლების ფასი და სხვა ფაქტორები. კლასიფიკაცია იქნება იმისათვის, რომ გქონდეთ ნაცვლად სახლების ორგანიზება, როგორიცაა დასაშვებობა, ლოტის ზომა ან დანაშაულის დონე.

სახეები რეგრესიული ტექნიკა

რეგრესიის უმარტივესი და უძველესი ფორმაა წრფივი რეგრესია, რომელიც გამოიყენება ორ ცვლადს შორის ურთიერთობის დასადგენად. ეს ტექნიკა იყენებს სწორი ხაზის მათემატიკურ ფორმებს (y = mx + b). ჩვეულებრივ ტერმინებში ეს ნიშნავს, რომ Y და X- ღერძების გრაფაში მოცემულია X და Y- ის ურთიერთობები, რომელთა სწორხაზოვან ხაზს წარმოადგენს რამდენიმე გამანადგურებელი. მაგალითად, შეიძლება ვივარაუდოთ, რომ მოსახლეობის ზრდა, სურსათის წარმოება იმავე მაჩვენებელზე გაიზრდება - ეს მოითხოვს ორ ფიგურებს შორის მყარი, წრფივი ურთიერთობების არსებობას. ამ თვალსაზრისით განიხილეთ დიაგრამა, რომელშიც Y- ღერძის პოპულაციის ზრდა და X- ღერძი საკვები პროდუქტების საჩვენებელია. როგორც Y ღირებულება იზრდება, X მნიშვნელობა გაიზრდება იმავე მაჩვენებლით, რაც მათ შორის სწორი ხაზია.

გაფართოებული ტექნიკა, როგორიცაა მრავალჯერადი რეგრესია, პროგნოზირება შორის ურთიერთობების მრავალჯერადი ცვლადები - მაგალითად, არსებობს კორელაცია შემოსავლის, განათლებისა და სადაც ერთი ირჩევს ცხოვრება? მეტი ცვლადის დამატება მნიშვნელოვნად ზრდის პროგნოზის სირთულეს. არსებობს რამდენიმე ტიპის მრავალჯერადი რეგრესიული ტექნიკა, მათ შორის სტანდარტული, იერარქიული, setwise და stepwise, თითოეული საკუთარი განაცხადი.

ამ ეტაპზე მნიშვნელოვანია იმის გაგება, თუ რას ვცდილობთ პროგნოზირება (დამოკიდებული ან იწინასწარმეტყველა ცვლადი) და მონაცემები, რომლებიც ჩვენ ვიყენებთ პროგნოზირების (დამოუკიდებელი ან პროგნოზირების ცვლადები). ჩვენს მაგალითში ჩვენ გვსურს, რომ განვსაზღვროთ ის ადგილი, სადაც ცხოვრობს ( იწინასწარმეტყველა ცვლადი) შემოსავალსა და განათლებაზე (ორივე პროგნოზირების ცვლადი).