Saturday, 15 September 2012

removing NA values from a DataFrame in Python 3.4 -


  पीडी आयात के आंकड़ों के रूप में आयात करें pdas df = print (pd.read_csv ('001.csv', keep_default_na = False , Na_values ​​= [""])) प्रिंट (डीएफ)  

मैं इस कोड का उपयोग एक डेटा फ्रेम बनाने के लिए कर रहा हूँ जिसमें कोई एनए वैल्यू नहीं है। मेरे पास कुछ सीएसवी फाइल हैं और मैं कॉलम में से किसी एक का मतलब गणना करना चाहता हूं - सल्फेट इस स्तंभ में कई 'एनए' मूल्य हैं, जो मैं बाहर करने की कोशिश कर रहा हूं। उपरोक्त कोड का उपयोग करने के बाद भी, 'एनए की डेटा फ्रेम से बाहर नहीं रखा गया है कृपया सुझाव दें।

विधि 1:

 < कोड> डीएफ [['ए', 'सी']]। लागू करें (लैम्ब्डा एक्स: माइ_फंक् (एक्स) अगर (एनपी.ऑल (पीडी.नोटनल (एक्स [1])) और एक्स, अक्ष = 1)  

पेंडस नोटल

विधि 2:

  df = df [ Np.isfinite (df ['EPS']]]  

विधि 3: ड्रॉपना का उपयोग

  में [24]: Df = pd.DataFrame (np.random.randn (10,3)) में [25]: df.ix [:: 2,0] = np.nan; Df.ix [:: 4,1] = एनपी.अनान; Df.ix [:: 3,2] = एनपी.अनान; में [26]: डीएफ आउट [26]: 0 1 2 0 NaN NaN NaN 1 2.677677 -1.466923 -0.750366 2 एनएएन 0.798002 -0.906038 3 0.672201 0.964789 NaN 4 NaN नैन 0.050742 5 -1.250 970 0.030561 -2.678622 6 नैन 1.036043 नैन 7 0.049896 - 0.308003 0.8232 9 8 नैन नैन 0.637482 9 -0.310130 0.0788 9 1 एनएएन में [27]: df.dropna () # सभी पंक्तियां जिनमें कोई भी NaN मान हैं, [27]: 0 1 2 1 2.677677 -1.466923 -0.750366 5 -1.250 9 70 0.030561 -2.678622 7 0.04 9 6,6 -0.308003 0.8232 9 9  

No comments:

Post a Comment