दिलचस्प पोस्ट
.flv फ़ाइल से NSArray में डेटा संरचना कैसे पढ़ें जावा मेमोरी उपयोग की निगरानी कैसे करें? कंसोल पर मुद्रण नहीं छपाई IOS या OSX पर सक्रिय इंटरनेट कनेक्शन की जांच कैसे करें? क्या एक सूची को स्तंभों में तोड़ने का कोई तरीका है? डेल्फी का उपयोग करके एचटीटीपी जीईटी यूआरएल को कॉल करने का सबसे आसान तरीका क्या है? क्या यह प्रोग्राम सी ++ में आईफोन में संभव है VB.NET में और और भी बीच क्या अंतर है? सी # 'है' ऑपरेटर का प्रदर्शन एंड्रॉइड पर स्व-हस्ताक्षरित एसएसएल स्वीकार्यता Kotlin Bytecode – IntelliJ IDEA में विश्लेषण करने के लिए कैसे? FileSystemWatcher के साथ फ़ाइल अभिगम त्रुटि जब एक से अधिक फ़ाइलें एक निर्देशिका में जोड़ दी जाती हैं एक UIScrollView के अंदर एक UITableView स्क्रोलिंग क्या SQL Server में dateTime और dateTime में कोई अंतर है? पायथन समर्थन करता है MySQL तैयार बयान?

HTML पृष्ठ पर सभी लिंक प्राप्त करें?

मैं थोड़ा शौक परियोजना पर काम कर रहा हूं। मैंने पहले ही एक यूआरएल प्राप्त करने के लिए कोड लिखा है, हेडर को डाउनलोड किया है और माइम प्रकार / सामग्री प्रकार वापस लौटा दिया है।

हालांकि, इससे पहले चरण एक पर अटक गया है – मुझे एक टैग के अंदर पेज पर सभी यूआरएल की सामग्री को पुनः प्राप्त करने की ज़रूरत है, और उद्धरण में

... <link rel='shortcut icon' href="/static/favicon.ico" type="image/x-icon" /> ... 

फ़ेविकॉन लिंक ढूंढें

क्या नेट पुस्तकालय में कुछ उपयोगी है या क्या यह regex के लिए एक मामला होगा?

वेब के समाधान से एकत्रित समाधान "HTML पृष्ठ पर सभी लिंक प्राप्त करें?"

मैं HTML एगिलिटी पैक का उपयोग करना चाहता हूं

पृष्ठ के सभी लिंक कैसे खोजना है, उनके उदाहरण पृष्ठ से यहां एक उदाहरण है:

  HtmlWeb hw = new HtmlWeb(); HtmlDocument doc = hw.Load(/* url */); foreach(HtmlNode link in doc.DocumentNode.SelectNodes("//a[@href]")) { } 

आपको HTML एगिलिटी पैक का उपयोग करना होगा

उदाहरण के लिए:

 var doc = new HtmlWeb().Load(url); var linkTags = doc.DocumentNode.Descendants("link"); var linkedPages = doc.DocumentNode.Descendants("a") .Select(a => a.GetAttributeValue("href", null)) .Where(u => !String.IsNullOrEmpty(u)); 

बीसीएल में कुछ भी नहीं बनाया गया है, लेकिन सौभाग्य से आप इस कार्य को पूरा करने के लिए बस HTML एगिलिटी पैक का उपयोग कर सकते हैं।

आपकी विशिष्ट समस्या के लिए, कृपया एचटीएमएलएगिलिटीपैक के साथ html के एक स्निपेट से आसानी से लिंक निकालने देखें:

 private List<string> ExtractAllAHrefTags(HtmlDocument htmlSnippet) { List<string> hrefTags = new List<string>(); foreach (HtmlNode link in htmlSnippet.DocumentNode.SelectNodes("//a[@href]")) { HtmlAttribute att = link.Attributes["href"]; hrefTags.Add(att.Value); } return hrefTags; } 

कैसे के बारे में Regex?

 <(a|link).*?href=(\"|')(.+?)(\"|').*?> 

झंडे के साथ SingleLine और SingleLine

Systemtextregularexpressions.com regex.matches पर डेमो देखें