दिलचस्प पोस्ट
एसक्यूएल: परिणाम पंक्ति को कई बार दोहराएं, और पंक्तियों की संख्या प्रोग्राम की मशीन पर कोर की संख्या का पता लगाएं फ़ंक्शन तर्क के रूप में jQuery डॉलर का चिह्न ($)? जावा में किसी मौजूदा फ़ाइल को पाठ की एक नई पंक्ति कैसे जोड़ें? सीएसएस के अंदर PHP कैसे चलाऊँ? कलेक्टरों। में मैप के लिए जावा 8 NullPointerException जावास्क्रिप्ट: वेरिएबल से पहले प्रतीक स्थान मोड को सक्षम करने के लिए उपयोगकर्ता को बिना सेटिंग के लिए उच्च सटीकता या बैटरी बचत, प्रोग्रामेटिक रूप से सेटिंग मैं चेतावनियों को कैसे ठीक कर सकता हूं: "हस्ताक्षरित और अहस्ताक्षरित के बीच तुलना"? टाइमआउट के साथ Waitpid समकक्ष? git, msysgit, लहजे, यूटीएफ -8, निश्चित जवाब कई शेख़ी गेंदों धागा मुद्दे जावास्क्रिप्ट के साथ एक स्ट्रिंग से फ़ंक्शन बनाने का कोई तरीका है? प्रक्रिया चल रहा है, जबकि लगातार उपप्रकाशन आउटपुट प्रिंट करें मैं जावा सैंडबॉक्स कैसे बनाऊं?

NumPy या Pandas: एक एनएएन मूल्य होने के दौरान एआरएर प्रकार को पूर्णांक के रूप में रखते हुए

क्या आंकड़ा प्रकार का numpy सारणी को int (या int64 या जो भी) के रूप में तय किया गया है, जबकि अभी भी तत्व को numpy.NaN रूप में सूचीबद्ध किया numpy.NaN ?

विशेष रूप से, मैं इन-हाउस डेटा स्ट्रक्चर को पांडस डेटाफ़्रेम में परिवर्तित कर रहा हूं। हमारे ढांचे में, हमारे पास पूर्णांक-प्रकार का कॉलम है जो अभी भी NaN है (लेकिन कॉलम का dtype int है)। ऐसा लगता है कि सब कुछ एक फ्लोट के रूप में दोहराते हैं यदि हम इसे एक डेटाफ़्रेम बनाते हैं, लेकिन हम वास्तव में int होना चाहते हैं

विचार?

चीजों की कोशिश की:

मैं from_records() अंतर्गत, coerce_float=False साथ from_records() फ़ंक्शन का उपयोग करने की कोशिश की और इससे मदद नहीं मिली मैंने NMPy नकाबपोश एरेज़ का उपयोग करने का भी प्रयास किया, साथ में NaN fill_value, जो भी काम नहीं कर रहा था। इनमें से सभी ने स्तंभ डेटा प्रकार को एक फ्लोट बनने के लिए बनाया।

वेब के समाधान से एकत्रित समाधान "NumPy या Pandas: एक एनएएन मूल्य होने के दौरान एआरएर प्रकार को पूर्णांक के रूप में रखते हुए"

NaN को एक पूर्णांक सरणी में संग्रहीत नहीं किया जा सकता। इस समय पंडों की एक ज्ञात सीमा है; मैं NumPy (आर में NAs के समान) में एनए वैल्यू के साथ प्रगति के लिए इंतजार कर रहा हूं, लेकिन NumPy को इन सुविधाओं को प्राप्त होने से पहले यह कम से कम 6 महीने का होगा, ऐसा लगता है:

http://pandas.pydata.org/pandas-docs/stable/gotchas.html#support-for-integer-na

यदि प्रदर्शन मुख्य मुद्दा नहीं है, तो आप इसके बजाय स्ट्रिंग स्टोर कर सकते हैं।

 df.col = df.col.dropna().apply(lambda x: str(int(x)) ) 

तब आप जितना चाहें उतना NaN साथ मिश्रण कर सकते हैं। यदि आप वास्तव में अपने आवेदन के आधार पर पूर्णांक चाहते हैं, तो आप -1 , या 0 , या 1234567890 , या किसी अन्य समर्पित मान को NaN का प्रतिनिधित्व करने के लिए उपयोग कर सकते हैं।

आप अस्थायी रूप से कॉलम डुप्लिकेट भी कर सकते हैं: एक के रूप में आपके पास, फ्लोट्स के साथ; अन्य एक प्रयोगात्मक, ints या तार के साथ फिर आवेषण हर उचित जगह की जाँच में कहा जाता है कि दो सिंक में हैं पर्याप्त परीक्षण के बाद आप फ्लोट्स को छोड़ सकते हैं।