दिलचस्प पोस्ट
अमान्य कारक स्तर, एनए द्वारा उत्पन्न VBScript: स्ट्रिंग को प्रारूपित करने का सबसे आसान तरीका क्या है? स्कला में नियमित अभिव्यक्ति का उपयोग करके पैटर्न कैसे मिलान करें? SQL सर्वर में सबसे छोटा अप्रयुक्त नंबर ढूंढें उन दस्तावेज़ों की क्वेरी जहां सरणी का आकार 1 से अधिक है सी में सी ++ का उपयोग कैसे करें? क्या रिपोर्टलैब के लिए एक मैटलप्लीब प्रवाह होता है? UIColor आरजीबीए मूल्यों के साथ काम नहीं कर रहा है अक्षरों और अंकों (या अंकों और अक्षरों के बीच) के बीच एक स्ट्रिंग कैसे विभाजित है? बटन C # (WinForms) में गोल किनारों चरित्र का आकार ('ए') सी / सी ++ में ग्रहण के लिए सर्वश्रेष्ठ जीयूआई डिजाइनर? स्थिर पैरामीटर के फ़ंक्शन के लिए दो आयामी सरणी को पास करें jQuery इवेंट कीप्रेस: ​​किस कुंजी को दबाया गया था? onActivityResult टुकड़ा में बुलाया जा रहा है नहीं है

HTML पृष्ठ पर सभी लिंक प्राप्त करें?

मैं थोड़ा शौक परियोजना पर काम कर रहा हूं। मैंने पहले ही एक यूआरएल प्राप्त करने के लिए कोड लिखा है, हेडर को डाउनलोड किया है और माइम प्रकार / सामग्री प्रकार वापस लौटा दिया है।

हालांकि, इससे पहले चरण एक पर अटक गया है – मुझे एक टैग के अंदर पेज पर सभी यूआरएल की सामग्री को पुनः प्राप्त करने की ज़रूरत है, और उद्धरण में

... <link rel='shortcut icon' href="/static/favicon.ico" type="image/x-icon" /> ... 

फ़ेविकॉन लिंक ढूंढें

क्या नेट पुस्तकालय में कुछ उपयोगी है या क्या यह regex के लिए एक मामला होगा?

वेब के समाधान से एकत्रित समाधान "HTML पृष्ठ पर सभी लिंक प्राप्त करें?"

मैं HTML एगिलिटी पैक का उपयोग करना चाहता हूं

पृष्ठ के सभी लिंक कैसे खोजना है, उनके उदाहरण पृष्ठ से यहां एक उदाहरण है:

  HtmlWeb hw = new HtmlWeb(); HtmlDocument doc = hw.Load(/* url */); foreach(HtmlNode link in doc.DocumentNode.SelectNodes("//a[@href]")) { } 

आपको HTML एगिलिटी पैक का उपयोग करना होगा

उदाहरण के लिए:

 var doc = new HtmlWeb().Load(url); var linkTags = doc.DocumentNode.Descendants("link"); var linkedPages = doc.DocumentNode.Descendants("a") .Select(a => a.GetAttributeValue("href", null)) .Where(u => !String.IsNullOrEmpty(u)); 

बीसीएल में कुछ भी नहीं बनाया गया है, लेकिन सौभाग्य से आप इस कार्य को पूरा करने के लिए बस HTML एगिलिटी पैक का उपयोग कर सकते हैं।

आपकी विशिष्ट समस्या के लिए, कृपया एचटीएमएलएगिलिटीपैक के साथ html के एक स्निपेट से आसानी से लिंक निकालने देखें:

 private List<string> ExtractAllAHrefTags(HtmlDocument htmlSnippet) { List<string> hrefTags = new List<string>(); foreach (HtmlNode link in htmlSnippet.DocumentNode.SelectNodes("//a[@href]")) { HtmlAttribute att = link.Attributes["href"]; hrefTags.Add(att.Value); } return hrefTags; } 

कैसे के बारे में Regex?

 <(a|link).*?href=(\"|')(.+?)(\"|').*?> 

झंडे के साथ SingleLine और SingleLine

Systemtextregularexpressions.com regex.matches पर डेमो देखें