სტატისტიკური ანალიზი: მონაცემთა ტიპები

Იხილეთ ასევე: კორელაციების გაგება

ჩვენი გვერდი ჩართულია დაკვირვების კვლევა და მეორადი მონაცემები აღწერილი იქნა მონაცემთა ორი ძირითადი წყარო (თქვენი საკუთარი კვლევა და მონაცემები, რომლებიც ადრე გამოქვეყნდა). ამასთან, არსებობს მრავალი სხვადასხვა ტიპის მონაცემები - და მონაცემთა კლასიფიკაცია რამდენიმე სხვადასხვა გზით შეიძლება. მონაცემთა ტიპი გავლენას მოახდენს მისი გამოყენების გზებზე და რა სტატისტიკური ანალიზია შესაძლებელი. ეს ასევე იმოქმედებს დასკვნებსა და დასკვნებზე, რომელთა გაკეთებაც შეგიძლიათ.

ამიტომ მონაცემთა მონაცემთა არჩევანი ძალიან მნიშვნელოვანია. ამ გვერდზე აღწერილია მონაცემთა ტიპების ზოგიერთი განსხვავება და გავლენა კვლევის მეთოდებსა და დასკვნებზე.

რაოდენობრივი და ხარისხობრივი მონაცემები

პირველი და ყველაზე აშკარა განსხვავებაა რაოდენობრივ და ხარისხობრივ მონაცემებს შორის:





  • რაოდენობრივი მონაცემები რიცხვითია: მათი შეგროვება და რიცხვით წარმოდგენა შესაძლებელია; და

  • თვისობრივი მონაცემები არ არის რიცხვითი.

ჩვენი გვერდი ჩართულია თვისობრივი და რაოდენობრივი კვლევა უფრო დეტალურად განმარტავს ამ განსხვავებას და ჩამოთვლილია ორივე უპირატესობა და უარყოფითი მხარე.

ობიექტური და სუბიექტური მონაცემები



მონაცემები ასევე შეიძლება დაიყოს ობიექტური და სუბიექტური.

  • ობიექტური მონაცემები არის დაკვირვებადი და გაზომვადი . ისინი მოიცავს ნივთებს, როგორიცაა სიმაღლე, წონა ან ელემენტების რაოდენობა. როგორც წესი, ისინი აგროვებენ დაკვირვების ან პირდაპირი გაზომვების საშუალებით.

  • სუბიექტური მონაცემები გროვდება ინდივიდუალური პირების პირადი კომუნიკაციებით . ეს შეიძლება იყოს ლაპარაკი ან დაწერილი, მაგრამ მას შეუძლია სხვა ფორმებიც მიიღოს. მაგალითად, სხეულის ენას შეუძლია სუბიექტური ინფორმაციის მიწოდება (” ის ისევ იწვა, თვალები დახუჭული და პირი მჭიდრო ჰქონდა [ობიექტური], თითქოს ტკივილები ჰქონდა [სუბიექტური] ”).



ობიექტური და სუბიექტური მონაცემები შეიძლება იყოს როგორც თვისებრივი, ისე რაოდენობრივი. მაგალითად, თქვენ შეგიძლიათ დააკვირდეთ (ობიექტური) ფერის ცვლილებას (ხარისხობრივ) და შეგიძლიათ სთხოვოთ ხალხს გამოთქვან თავიანთი მოსაზრებები საკითხის შესახებ (სუბიექტური) ციფრული მასშტაბის (რაოდენობრივი) გამოყენებით.

რა მნიშვნელობა აქვს რიცხვს

ორივე ტიპს აქვს დადებითი და უარყოფითი მხარეები. მაგალითად, სუბიექტურ მონაცემებს შეუძლია ინფორმაციის ბევრად უფრო ფართო სპექტრის მოწოდება, რადგან ბევრი რამ უბრალოდ განუზომელია. ეს მოიცავს ცვლადებს, როგორიცაა ტკივილის დონე, სადაც ყველას აქვს საკუთარი ინტერპრეტაცია. 1 – დან 10 – მდე მასშტაბის გამოყენებაც კი, რაც მონაცემებს რაოდენობრივს ხდის, არ ნიშნავს, რომ ის პირდაპირ შედარებადი იქნება ინდივიდებს შორის.

ამასთან, სუბიექტური მონაცემები დამოკიდებულია იმაზეც, რომ ადამიანებს რამ ახსოვთ და ზუსტად აფასებენ. ამიტომ სუბიექტური მონაცემები, სავარაუდოდ, უფრო არასანდო იქნება, როდესაც ხალხს მოუწევს ახსოვდეს უფრო ძველი მოვლენები.



შესაბამისად, სადაც ეს შესაძლებელია, სასურველია ობიექტური მონაცემები, მაგრამ არსებობს ზოგადი გაგება, რომ ზოგჯერ მხოლოდ სუბიექტური მონაცემები არსებობს.



გრძივი და განივი მონაკვეთი

გრძივი და განივი მონაცემების განსხვავება სინამდვილეში უფრო მეტი განსხვავებაა სასწავლო დიზაინი ვიდრე მონაცემთა ტიპი.

  • გრძივი კვლევები დროთა განმავლობაში იმავე ჯგუფთან მუშაობა. ამიტომ მათ შეუძლიათ დროთა განმავლობაში აჩვენონ ცვლილებები და განსაზღვრონ მიზეზობრივი კავშირი.

  • განივი კვლევები შეიძლება მონაცემების შეგროვება დროის სხვადასხვა მონაკვეთში, მაგრამ სხვადასხვა ჯგუფისგან. მათ მხოლოდ დროში შეუძლიათ აჩვენონ კადრი ან კადრების სერია.

გადამწყვეტი განსხვავება კვლევის ორ ტიპს და, შესაბამისად, მონაცემებს შორის არის ის, რომ გრძივ მონაცემებს შეუძლიათ მიზეზობრიობის დემონსტრირება.

ზოგადად შეუძლებელია მიჩნეული მიზეზობრიობის დემონსტრირება განივი მონაკვეთიდან, რადგან თქვენ გაქვთ ინფორმაცია მხოლოდ დროის ერთი მომენტის შესახებ. ამიტომ შეუძლებელია რაიმეს შეცვლა და იმის დანახვა, თუ რა გავლენას ახდენს ეს (ანუ, თუ არსებობს) მიზეზობრივი კავშირი )

ამასთან, განივი კვლევები ბევრად უფრო მოსახერხებელია. თქვენ მხოლოდ ერთი გამოკვლევა ან კვლევა უნდა ჩაატაროთ, ვიდრე დროთა განმავლობაში კოჰორტას მიჰყვეთ. გრძივმა გამოკვლევებმა შეიძლება წარმოადგინოს ძალიან მაღალი ხარისხის მონაცემები და აჩვენოს მიზეზები, მაგრამ განიცდიან პრობლემებს, როგორიცაა ჯგუფის დატოვება. ასევე ძნელია დაფინანსების მიღება გრძელვადიანი, მაღალი ხარისხის გრძივი კვლევებისთვის.

მაგალითი: კვეთის და გრძივი კვლევების შერწყმა


Surrey კომუნიკაციისა და ენის განათლებაში სწავლა (მასშტაბები) ) არის გრძელვადიანი გრძივი კვლევის კარგი მაგალითი, რომელიც ასევე მოიცავდა კვეთის გარკვეულ ელემენტებს.

კვლევის პირველი ელემენტი იყო ფართომასშტაბიანი გამოკითხვა ბავშვების მისაღებში, სურეის 180 დაწყებით სკოლაში. მოსახლეობის ყველა ბავშვი გაეცნო ენის ცოდნას სკოლის შესვლისას, კლასის მასწავლებლების მიერ ჩატარებული გამოკითხვის საფუძველზე. მათ ჰკითხეს ქცევის, ენისა და სოციალური უნარების შესახებ. ამან წარმოადგინა ენის შესაძლებლობების მოკლე შინაარსი სკოლაში შესვლისთანავე, და მკვლევარებს საშუალება მისცა შეაფასონ, შეესაბამება თუ არა სასწავლო გეგმა შესაძლებლობებს და დადგინდეს, რომ მცირეწლოვან ბავშვებს უფრო ხშირად აქვთ ენის პრობლემები.

შემდეგ ეტაპზე შერჩეულ იქნა 590 ბავშვის ნიმუში, რომლებიც გამოკვლეულ იქნა, ფენის მიხედვით, პირველი ეტაპის დასკვნების მიხედვით, სხვადასხვა ენობრივი შესაძლებლობების დასადგენად. ისინი მკვლევარმა ნახა 1, და ისევ 3 წელს და შეაფასა მათი ენობრივი უნარები. მშობლებს ასევე სთხოვეს მიეწოდებინათ ინფორმაცია ენისა და ქცევის შესახებ ორივე ეტაპზე.

შემდეგ ეტაპზე დაიწყო SCALES ჯგუფის ორიგინალი მე –6 და მე –8 წლებში, მათი სოციალური, ემოციური და ფსიქიკური ჯანმრთელობის შედეგების შესაფასებლად.

მკვლევარებს აინტერესებდათ კავშირი ადრეულ ბავშვობაში ენის განვითარებასა და მოზარდობის ასაკში სოციალურ და ემოციურ განვითარებას შორის. ამგვარი ინფორმაციის შეგროვება უბრალოდ არ შეიძლება კვეთავიანი კვლევიდან, ან სხვადასხვა ასაკის ორი ცალკეული კვლევიდან. შეგიძლიათ სთხოვოთ მონაწილეებსა და მშობლებს, დაფიქრდნენ, მაგრამ დროის ხარვეზი ისეთია, რომ გახსენება სავარაუდოდ არ იქნება საიმედო.

კატეგორიული, უწყვეტი, დისკრეტული და რანჟირებული მონაცემები

სხვა განსხვავებაა კატეგორიული, უწყვეტი, დისკრეტული ან რანჟირებული მონაცემები:

  • კატეგორიული მონაცემები იყოფა ცალკეულ ჯგუფებად ან კატეგორიებად .

    ამიტომ, მათ შორისაა, მაგალითად, სქესი, გინდა თუ არა ნაყინი და თუ ოდესმე ნამყოფი ხარ კონკრეტულ ქვეყანაში. მათში შეიძლება ასევე იყოს ასაკი, თუ იგი აჯგუფებულია ათი ან ხუთწლიან ბლოკებად.

  • უწყვეტი მონაცემები განისაზღვრება, როგორც ის, რომელთაც შეუძლიათ მიიღონ უსასრულო რაოდენობის მნიშვნელობები ნებისმიერ ორ მნიშვნელობას შორის.

    ეს რთულად ჟღერს, მაგრამ სინამდვილეში მარტივია. ეს არის მონაცემები, როგორიცაა წონა ან სიმაღლე, რომელიც შეიძლება იყოს ნებისმიერი მნიშვნელობა შესაძლო წონისა და სიმაღლის დიაპაზონში, არა ფიქსირებული მნიშვნელობები, ან კლასის პროცენტი, რომელსაც უყვარს ნაყინი (ნებისმიერი მნიშვნელობა 0-100% დიაპაზონში). თითოეული მონაცემთა წერტილი არის ცალკეული და ცალკეული რიცხვი და არ ჯდება ჯგუფში. მაგალითად, ასაკი ჩათვლით, თუ მას ძალიან ზუსტად გაზომავთ წელიწადის დღეებში ან წილადებად, ვიდრე მთლიანი წლებით.

    როგორ დავწეროთ სწორი წინადადება
  • დისკრეტული მონაცემები განისაზღვრება, როგორც ის, ვისაც აქვს განსაზღვრული რაოდენობის შესაძლო მნიშვნელობები ნებისმიერ ორ მნიშვნელობას შორის

    ამიტომ დისკრეტული მონაცემები მოიცავს მომხმარებელთა საჩივრების რაოდენობას, ან იმ ადამიანების რაოდენობას, ვისაც ნაყინი მოსწონს, ანუ თქვენ ვერ გექნებათ საჩივრის ნახევარი, ან ადამიანის მესამედი. სხვა მაგალითი იქნება ასაკი მთელი წლების განმავლობაში. ანალიზის მიზნით, დისკრეტული მონაცემები განიხილება, როგორც ძალიან უწყვეტი მონაცემები.

  • დალაგებულია და დალაგებულია რანჟირებული მონაცემები, შემდეგ კი მათი ნუმერაცია ხდება მათი წოდებების მიხედვით

    მაგალითად, თუ თქვენ გქონდათ მონაცემების ოთხი ბიტი 4, 6, 3 და 7 მნიშვნელობებით, შეგიძლიათ ადიდებული თანმიმდევრობით შეაფასოთ ისინი 3, 4, 6 და 7-ით. შემდეგ ისინი მიიღებენ თავიანთ წოდებას, ასე რომ 3 1 (1), 4 იქნება 2 (2) და ა.შ. ზოგადად, მონაცემები რანჟირდება, როდესაც შენთვის საინტერესოა მხოლოდ შეკვეთა და არა აბსოლუტური მნიშვნელობები. ეს ჩვეულებრივ ხდება, როდესაც ორი ცვლადი ერთად იცვლება, მაგრამ მათ არ აქვთ სწორი ხაზის კავშირი (ანუ ისინი განსხვავდებიან სხვადასხვა ტემპით). მაგალითად, ქვემოთ მოცემულ გრაფიკში მოცემულია ამ ტიპის ურთიერთობა (ამ შემთხვევაში, ექსპონენციალური).

    დიაგრამა, რომელიც გვიჩვენებს ექსპონენციალურ კავშირს ორ ცვლადს შორის.

    გაფრთხილება!


    მნიშვნელოვანია გვახსოვდეს, რომ როდესაც მონაცემებს ადგენთ, ინფორმაციას კარგავთ.

    ამიტომ ეს მხოლოდ მაშინ უნდა გაკეთდეს, როდესაც ამის გაკეთება ნამდვილად გჭირდებათ.


ამ ოთხი ტიპის მონაცემები შესაფერისია სხვადასხვა ტიპის ანალიზისთვის - და თითოეული თქვენგანისთვის უნდა გამოიყენოთ სხვადასხვა სტატისტიკური ტესტები და ანალიზის ფორმები.

ანალიზისთვის სხვადასხვა ტიპის მონაცემების გამოყენების შესახებ დამატებითი ინფორმაციისთვის, გთხოვთ, გაეცნოთ ჩვენს გვერდს კორელაციები .

დასკვნა

არსებობს მრავალი სხვადასხვა ტიპის მონაცემები, რომლებიც შეგიძლიათ შეაგროვოთ თქვენი კვლევის ფარგლებში. მონაცემთა ტიპის არჩევას, როგორც წესი, განაპირობებს თქვენი კვლევის მეთოდები, რაც, თავის მხრივ, განპირობებულია თქვენი კვლევის კითხვით და თქვენი ზოგადი მიდგომით კვლევის მიმართ. ამასთან, მონაცემთა ტიპის არჩევას აქვს გავლენა ანალიზის ტიპზე და იმ დასკვნებზე, რომელთა გაკეთებაც შეგიძლიათ.


Გაგრძელება:
კორელაციების გაგება
მარტივი სტატისტიკური ანალიზი