Friday, 15 August 2014

Python How to get Scrapy Xpath data from Basic Table? -


  & lt; टैब & gt; & Lt; br & gt; & LT; टीआर & gt; & Lt; टीडी चौड़ाई = 270 & gt; & lt; p align = "left" style = "margin-left: 0;" gt; & lt; b & gt; सूचना & lt; / b & gt; & lt; / p & gt; & lt; / td & gt; & LT; टीडी & gt; & lt; p & gt; & Lt; / p & gt; & lt; / टीडी & gt; & Lt; / टीआर & gt; & LT; टीआर & gt; & Lt; टीडी चौड़ाई = 270 & gt; & lt; p align = "left" शैली = "मार्जिन-बाएं: 10;" & gt; पृष्ठ & amp; nbsp; गणना & lt; / p & gt; & lt; / td & gt; & LT; टीडी & gt; & lt; p & gt; = 4 & lt; / p & gt; & lt; / td & gt; & Lt; / टीआर & gt; ...  

ऊपर दिए गए तालिका से = 4 मान के लिए response.xpath प्राप्त करने की कोशिश कर रहा है। यहां तक ​​कि जब क्रोम में तत्व का निरीक्षण किया जाता है और xpath को खींचती है तो मैं एक मूल्य [] के साथ समाप्त होता है I कोशिश की गई:

  / html / body / table [1] / tr [2] / td [2] // टेबल [2] / tr [2] / td [2]  

दोनों विफल हो जाते हैं।

मुझे td < / Code> इसके बजाय गणना टेक्स्ट और फिर निम्न-भाई / प्राप्त करें:

  // td [contains (p, "count" )] / निम्नलिखित- sibling :: td / p / text ()  

डेमो:

  $ scrapy shell index.html में [1]: प्रतिक्रिया [1]: [u '= 4']     कोड>  

और अगर आप वास्तविक संख्या निकालना चाहते हैं, तो इसका प्रयोग करें:

  में [2]: response.xpath ('// td [contains (p, " [2]: [u'4 ']  
/ div>

No comments:

Post a Comment