發布時間:2020-12-12 16:05 作者:獨孤劍 閱讀:2487
C# 正則獲取網頁內容, 抓取html源代碼里的 title
using System.Text.RegularExpressions;
static void Main(string[] args) { // 注意文本編碼, 建議選擇utf-8格式編碼, 要不容易出現亂碼 string content = System.IO.File.ReadAllText("html源代碼.txt"); // 建立正則匹配, 抓取html源代碼里的title string titleReg = "(?<=<title>)(.*?)(?=</title>)"; string title = ""; try { // 正則匹配 Match m = Regex.Match(content, titleReg); if (m.Success) { title = m.Value; } Console.WriteLine(title); } catch (Exception ex) { Console.WriteLine(ex.Message); } Console.Read(); }
“html源代碼.txt”示例內容
<!DOCTYPE html> <html> <head> <title>標題</title> </head> <body> 內容 </body> </html>
微信打賞, 微信掃一掃
支付寶打賞, 支付寶掃一掃
如果文章對您有幫助,歡迎給作者打賞