इसी तरह, numpy.genfromtxt
मेरे कॉलम के नामों को संशोधित करता है:
आयात के रूप में एनपीपी को आयात करें IO आयात से बाइटियो # https://stackoverflow.com/a/11970414/321973 str = 'x, -1,1 \ n0,1,1 \ n1,2,3' डेटा = एनपी (Code.type.names) प्रिंट
पैदावार ('x', 'x', '1', '1_1')
वांछित के बजाय ('एक्स', '-1', '1')
(या इससे भी बेहतर, ('x' -1, 1)
)। मैंने कोशिश की deletechars = "" ~! @ # $% ^ & Amp; () = + ~ \ |]} [{';: /? & Gt ;, & lt; "" "
जैसा कि सुझाव दिया गया है कोई फायदा नहीं हुआ।
आप जो व्यवहार देख रहे हैं वह इस तथ्य से होता है कि क्षेत्रनाम के नाम से कुछ गैर-अल्फ़ान्यूमेरिक वर्णों को स्वचालित रूप से पट्टी करने के लिए genfromtxt np।
का उपयोग करता है NameValidator
वर्ग।
यह एक फ़ील्ड नाम के लिए पूरी तरह से एक - '
चरित्र, उदा:
x = np.array ((1,), dtype = [(' - 1 ',' i ')]) प्रिंट (x [ '-1']) # 1
वास्तव में, संशोधित फ़ील्ड नामों में से दो में से दो, जो आप np.genfromtxt
से वापस प्राप्त करते हैं "मान्य नहीं हैं पायथन पहचानकर्ता "( '1'
और '1_1'
, चूंकि वे अंक से शुरू करते हैं)।
जब तक आप फील्ड नामों को सेट करने के लिए np.genfromtxt
का इस्तेमाल करते हुए बाईपास करते हैं ऐसा करने का एक तरीका एक खाली सरणी को इनिशियलाइज़ करना होगा, फ़ील्ड नामों और डीटीक्स् को स्पष्ट रूप से निर्दिष्ट करें, फिर इसे शेष स्ट्रिंग सामग्री से भरें:
names = str.splitlines () [ 0] .split (',') प्रकार = ('मैं',) * 3 dtype = ज़िप (नाम, प्रकार) डेटा = np.empty (2, dtype = dtype) डेटा [:] = np.genfromtxt (BytesIO ( # (। (0, 0, 1), (1, 0, 2)], # Dtype = [('x', '& lt; i4'), ('-1', '& lt; i4'), ('1', '& lt; i4')])
< P> हालांकि, सिर्फ इसलिए कि आप इसका मतलब यह नहीं कर सकते कि आपको चाहिए - आपके क्षेत्र के नामों में से एक में '-'
होने के कारण अन्य अप्रत्याशित परिणाम हो सकते हैं सबसे सुरक्षित विकल्प केवल वैध पायथन पहचानकर्ताओं को फ़ील्ड नाम के रूप में उपयोग करने के लिए छड़ी करना है।
No comments:
Post a Comment