Thursday 28 December 2017

स्टाटा फॉरेक्स में निरंतर चर रैंक


सूचना: आईडीआरई सांख्यिकी परामर्श समूह वेबसाइट को वर्डप्रेस सीएमएस में फरवरी में माइग्रेट कर देगा ताकि नई सामग्री के रख-रखाव और सृजन की सुविधा मिल सके। हमारे कुछ पुराने पृष्ठों को हटा दिया जाएगा या संग्रहीत किया जाएगा ताकि उन्हें अब बनाए रखा नहीं जाएगा हम रीडायरेक्ट बनाए रखने का प्रयास करेंगे ताकि पुरानी यूआरएल हम जितनी अच्छी तरह काम कर सकें उतना काम जारी रहेगा। डिजिटल रिसर्च और एजुकेशन फॉर डिजिटल रिसर्च एंड एजुकेशन में आपका स्वागत है एक उपहार देने के लिए स्टेट कंसल्टिंग ग्रुप द्वारा सहायता करें। स्टेटा एफएक्यू। मैं समूहों में लगातार वैरिएबल्स कैसे पढ़ सकता हूं? कई बार हो सकता है कि आप एक सतत वैल्यू को समूह में परिवर्तित करना चाहें। उदाहरण के लिए, आप एक निरंतर पठन स्कोर को परिवर्तित कर सकते हैं जो कि 0 से 100 से लेकर 3 समूहों तक (कम, मध्यम और उच्च) कहते हैं। आप जल्दी से और आसानी से इसे करने के लिए कट () फ़ंक्शन के साथ ईजन का उपयोग कर सकते हैं, जैसा कि नीचे सचित्र है। हम इसे एचएसबी 2 डेटा फ़ाइल के साथ वर्णन करेंगे जो कि एक चर नाम से लिखा है जो कि 31 से 67 के बीच होती है। हम ईजेंस का इस्तेमाल कर सकते हैं जो कि एक चर का नाम लिखते हैं जो कि चरणीय को निम्नलिखित 4 श्रेणियों में लिखते हैं। 30 से ऊपर (लेकिन इसमें शामिल नहीं) 40 40 तक (लेकिन इसमें शामिल नहीं) 50 50 अप करने के लिए (लेकिन इसमें शामिल नहीं) 60 60 अप करने के लिए (लेकिन इसमें शामिल नहीं है) 70 नीचे दी गई तालिका कमांड को यह सत्यापित करने के लिए उपयोग किया जाता है कि डेटा को समूहित किया गया है हम उम्मीद करते थे हम यह देख सकते हैं कि जब writecat सबसे कम श्रेणी (30) में है जो 31 से 39 तक की सीमाओं को लिखता है, और आगे की अपेक्षा की जाती है, उदा। जब writecat 30 श्रेणियों में है, तो मानों को 30 अप करने के लिए (लेकिन इसमें शामिल नहीं) 40 लिखने के लिए अनुरूप है। यहां हम एक ही कमांड का प्रयोग करते हैं लेकिन हमारी पिछली श्रेणी 50 से 60 तक है। जैसा कि आप देखते हैं, यह एक अनुपलब्ध मूल्य उत्पन्न करता है क्योंकि ऐसे कई मूल्य हैं जो 60 या अधिक हैं और इस प्रकार हम निर्दिष्ट सीमा के बाहर हैं यह दर्शाता है कि यदि आपके द्वारा प्रदान की जाने वाली श्रेणी के बाहर मूल्य हैं, तो उन्हें एक लापता मूल्य निर्दिष्ट किया जाएगा। अगर हम आईकोड्स विकल्प का उपयोग करते हैं, तो कट () पूर्णांक कोड 0, 1, 2 और इसी तरह बनाएगा। नीचे दिए गए उदाहरण में, आप देख सकते हैं कि उसने 0, 1, 2 और 3 को कोड बनाया है। यदि आप लेबल विकल्प (जो स्वचालित रूप से आईआईडीडी अर्थ होता है) का उपयोग करते हैं, तो यह ऊपर की तरह पूर्णांक मान बनाएगा, लेकिन यह मूल्य लेबल भी बनाएगा जैसा कि आप नीचे देख रहे हैं, variable writecat4 का लेबल 30- 40- 50- और 60- है। हम मूल्य लेबल्स के प्रदर्शन को दबाने के लिए नोलबेल विकल्प का उपयोग करते हैं और आप देख सकते हैं कि चर वास्तव में 0, 1, 2 और 3 को कोडित है। अगर आप चाहें, तो आप कटे () से पूछ सकते हैं कि समूह बनाने के लिए कटऑफ का चयन लगभग एक ही नंबर प्रति समूह नीचे हम 4 (मोटे तौर पर) समान आकार के समूहों के निर्माण का अनुरोध करते हैं। अधिक जानकारी के लिए, एंजिन के बारे में सहायता या संदर्भ पुस्तिका देखें। इस वेब साइट की सामग्री को कैलिफोर्निया विश्वविद्यालय द्वारा किसी विशेष वेब साइट, किताब या सॉफ़्टवेयर उत्पाद के समर्थन के रूप में नहीं समझा जाना चाहिए। टास्क 1 सी: स्टेटा का उपयोग कर NHANES में मौजूद डेटा को पहचानने और पुन: दर्ज करने के लिए पहला कार्य पहचानना है लापता डेटा और इसे याद रखना। यहां चरण दिए गए हैं: अनुपलब्ध और अनुपलब्ध मानों को पहचानें अनुपलब्ध मानों के रूप में अनुपलब्ध मान गायब होने की संख्या का मूल्यांकन करें चरण 1: अनुपस्थित और अनुपलब्ध मानों को पहचानें इस चरण में, आप टैबस्टेट का उपयोग करेंगे और कम से कम अधिकतम मूल्यों निरंतर चर और अपने मास्टर विश्लेषणात्मक डेटासेट में स्पष्ट चर की आवृत्ति वितरण को देखने के लिए टैबलेट कमांड। इन कमानों से आउटपुट, प्रक्रिया विवरण में सूचीबद्ध प्रत्येक चर के लिए संख्या और लापता मूल्यों की आवृत्ति प्रदान करता है। सामान्यतया कमांड, टैबस्टैट या संक्षेप का उपयोग निरंतर चर के लिए किया जाता है, और सारिणी स्पष्ट चर के लिए उपयोग किया जाता है निम्नलिखित उदाहरण में, टैबस्टैट और टैबलेट कमांड निरंतर और स्पष्ट चर को भेद किए बिना चर के समान सेट पर उपलब्ध कराए जाते हैं। यदि आप कई मूल्यों के साथ निरंतर चर पर टैबलेट कमांड का उपयोग करते हैं, तो आउटपुट व्यापक हो सकता है। न्यूनतम मूल्य (न्यूनतम), और अधिकतम मूल्य (अधिकतम), और उन प्रतिभागियों के लिए चयनित चर के लिए अनुपस्थित टिप्पणियों की संख्या को निर्धारित करने के लिए टैबस्टेट और एनएमसिंग कमांड का उपयोग करें, जिन्हें साक्षात्कार और एमईसी में जांच की गई थी और जो 20 साल या उससे अधिक उम्र के थे । tabstat bpq mcq यदि (सुराग gt20 amp ridageyr lt।) amp ridstatr2, stat (n min max) nmissing bpq mcq अगर (ridageir gt20 amp ridageyr lt।) amp ridstatr2 चर के प्रत्येक मान की आवृत्ति निर्धारित करने के लिए tabulate command का उपयोग करें प्रतिभागी जो एमईसी में साक्षात्कार और जांच की गई थी और जिनकी उम्र 20 वर्ष और अधिक थी लापता मूल्यों को प्रदर्शित करने के लिए अनुपलब्ध विकल्प का उपयोग करें। टैबलेट बीपीक्यू 0010 अगर (सुराग जीटी 20 एएमपी सुदाकर एलटी।) एफ़ रोडस्टेट 2, कमांड टैबस्टैट, एनएमआईएनएस और आउटपुट को टैबलेट से लिखे गए आइटमों को छूटा: पंक्ति लेबल किए गए एनटीएन डेटा के साथ अवलोकन की संख्या को दर्शाता है इस उदाहरण में चर के लिए 9,376 टिप्पणियां हैं, बीपीक्यू020, लेबल वाले उद्धरणकर्ता ने बताया कि उच्च रक्तचाप लापता डेटा के बिना अवलोकन की संख्या को इंगित करता है। इस उदाहरण में चर BPQ.020 के लिए 95 लापता अवलोकन हैं। एक चर के प्रत्येक प्रतिक्रिया मूल्य एक आवृत्ति (हर मूल्य के लिए परिभाषा निर्धारित करने के लिए कोडबुक की जांच) आवृत्ति है इस उदाहरण में, बीपीक्यू.एक्स। चर वाले डायलर, जो कि एक चिकित्सक द्वारा दिए गए अंतिम रक्तचाप को लेबल किया जाता है, को quot करते हुए सात संभावित प्रतिक्रिया मान हैं। (लापता), कोट 1, कोट 2, उद्धरण 3, उद्धरण 4, कोट 5, और कोट 9 कॉलम लेबल quot फ्रैक इंगित करता है जिसके साथ डेटासेट में एक विशेष प्रतिक्रिया मान होता है। इस उदाहरण में, दो टिप्पणियों के एक उद्धरण है। (लापता) मूल्य और 6,75 9 टिप्पणियों के पास 1 मूल्य है कॉलम लेबल वाले उद्धरण प्रतिशत का प्रतिशत दर्शाता है, जिसके लिए कुल में से, चर खातों के प्रत्येक मान। कोट (लापता) और कुल 1 9 2 के लिए बीपीक्यू .010 खाते के जवाब मूल्य, क्रमशः 0.02 और 71.37। चर बीपीक्यू 0,070 के लिए नोट, जिसका नाम "जब रक्त कोलेस्ट्रॉल आखिरी बार चेक किया गया था, तो एक अवलोकन के पास 7 का मूल्य होता है और 52 टिप्पणियों का उद्धरण मूल्य 9 है ये इस सवाल के लिए प्राप्त किए गए उत्तरों को ध्यान में रखते हुए और जवाबों के बारे में बताते हैं। इन टिप्पणियों को याद किए जाने की आवश्यकता होगी, जो अगले चरण में शामिल किए जाएंगे। चरण 2: लापता अनुपलब्ध मान दो विकल्प अनुपयोगी डेटा को पढ़ने के लिए उपयोग किए जा सकते हैं: योग्यता का उपयोग करते हुए एक समय में एक वैरिएबल असाइन करें, या फोरच पावर कमांड का उपयोग करके समूह द्वारा ग़ैर मान निर्दिष्ट करें। विकल्प 1 एक समय में एक वैरिएबल गुम वैल्यू असाइन करें यदि योग्यता के रूप में एक चर के quot7quot और quot 9quot मानों को याद करने के लिए प्रयोग किया जाता है तो अनुपलब्ध bpq010 की जगह यदि bpq0107 bpq0109 विकल्प 2 - समूह द्वारा अनुपलब्ध मानों को असाइन करें, लापता एक चर के quot7quot और quot 9quot मूल्यों को पढ़ने के लिए foreach लूप कमांड का उपयोग करें। इस विकल्प का उपयोग करें जब आप कई चर को पढ़ना चाहते हैं जो कि quotrefusedquot और quotnont knowquot के लिए समान संख्यात्मक मान का उपयोग करते हैं Recoded मानों के साथ एक नया डाटासेट बनाने के लिए सहेजें कमांड का उपयोग करें foreach i में bpq020 bpq050a bpq100d bpq070 bpq080 mcq160b mcq160c mcq160d mcq160e mcq160f मुझे प्रतिस्थापित करते हैं I यदि i gt7 को बचाया है C: NhanesDatademobp1, चरण 3 की जगह: अनुपलब्ध डेटा की मात्रा का मूल्यांकन करें इस चरण में आप यह सुनिश्चित करने के लिए टैबलेट कमांड का प्रयोग करेंगे कि पिछले चरण में किए गए रीकोडिंग सही तरीके से किया गया था। एक सामान्य नियम के रूप में, यदि आपके विश्लेषणात्मक डेटासेट में एक चर के लिए आपके डेटा का 10 या उससे कम डेटा अनुपलब्ध है, तो यह सामान्यतः आपके मूल्यांकन को बिना आगे मूल्यांकन या समायोजन जारी रखने के लिए स्वीकार्य है। हालांकि, यदि वेरिएबल के लिए 10 से अधिक आंकड़े गायब हैं, तो आपको यह निर्धारित करने की आवश्यकता हो सकती है कि अनुपस्थित मूल्यों को सामाजिक-जनसांख्यिकीय विशेषताओं में समान रूप से वितरित किया जाता है या नहीं, और यह तय करने के लिए कि क्या अनुपस्थित मूल्यों के आगे दोष लगाना या समायोजित भार का उपयोग आवश्यक है या नहीं। (कृपया अधिक जानकारी के लिए विश्लेषणात्मक दिशानिर्देश देखें)। लापता डेटा की सीमा की जांच करें प्रतिभागियों के लिए सूचीबद्ध वेरिएबल्स के प्रत्येक मूल्य की आवृत्ति निर्धारित करने के लिए टैबलेट कमांड का प्रयोग करें जिन्हें एमईसी में साक्षात्कार और जांच की गई थी और जो 20 साल या उससे अधिक उम्र के थे। लापता मूल्यों को प्रदर्शित करने के लिए अनुपलब्ध विकल्प का उपयोग करें। एकाधिक चर की आवृत्ति प्राप्त करने के लिए foreach लूप कमांड का उपयोग करें। बीपीक्यूएफ़टीएटीटी 2, यदि (सुराग जीटी 20 एएमपी सुराइजरी लेफ्टिनेंट।) एफ़ रोडस्टेट 2, बीपीक्यू020 बीपीक्यू070 बीपीक्यू 080 एमसीपी 160 बी एमसीके 160 सी एमसीक्यूए 60 डी एमसीक्यू 60 एमसीक्यूएटीएफटीपी में लापता प्रक्षेपण आई, यदि मैं (सुराग जीटी 20 एएमपी सुदाई लेफ्टिनेंट।) एफ़ रोडस्टाट्र 2, लापता याद रखने के लिए टैबलेट आउटपुट से हाइलाइट किए गए आइटम मूल्य: इस उदाहरण में, बीपीक्यू.010, चर वाले डॉक्टर, जो कि एक डॉक्टर द्वारा रक्तचाप को पढ़ने के लिए लेबल के रूप में चिह्नित किया गया था, अब मूल उद्धरण के पहले केवल छह प्रतिक्रिया मूल्यों के बजाय मूल्य उद्धरण 9 अब मौजूद नहीं है। यह भी ध्यान दें कि अब कुल 18 लापता मूल्य हैं (मूलतः दो के बजाय) इस आउटल्यूशन की समीक्षा दर्शाती है कि quot 9 मान को सफलतापूर्वक याद किया गया है और अब इसे लापता (।) के रूप में वर्गीकृत किया गया है। ध्यान दें कि चर BPQ.030 (quotTold में उच्च रक्तचाप था - 2 बार) अभी भी एक उद्धरण मूल्य मौजूद है, जो कि उत्तरदायतों को पता चलता है। यह मान recoded नहीं था क्योंकि यह चर एक छोड़ पैटर्न का हिस्सा है। छोड़े गए वैरिएबल के लिए लापता मूल्यों को चर के लिए अनुपलब्ध मानों से भिन्न रूप से अलग अर्थ है, जो छोड़ पैटर्न का हिस्सा नहीं हैं। । आप अगले कार्य में स्किप पैटर्न की पहचान करने और उसका इलाज करने की समीक्षा करेंगे। ध्यान दें कि चर BPQ.070 के लिए टिप्पणियों की 34.71, जिसे "जब रक्त का कोलेस्ट्रॉल आखिरी बार चेक किया गया था, के रूप में चिह्नित किया गया है, तो मूल्यों को याद नहीं है I प्रोग्राम और आउटपुट का एनीमेशन देखें

No comments:

Post a Comment