① 用正則表達式怎麼匹配網頁中的這些內容
如果只要匹配這一段可以用
<td>\s+"附加題名[^<]+(?:<[^>]+>[^<]+)+</td>
如果要把不在<>中的內容匹配到(PHP、及「經典編程265例 」等),比較麻煩些:
附加題名[^<]+<[^>]+>([^<]+)<[^>]+>([^<]+)<[^>]+>([^<]+)<[^>]+>([^<]+)<[^>]+>([^<]+)<[^>]+>([^<]+)</td>
共有6組捕獲, \1~\6 分別是 PHP 、"經典編程265例 "、PHP……