① 用正则表达式怎么匹配网页中的这些内容
如果只要匹配这一段可以用
<td>\s+"附加题名[^<]+(?:<[^>]+>[^<]+)+</td>
如果要把不在<>中的内容匹配到(PHP、及“经典编程265例 ”等),比较麻烦些:
附加题名[^<]+<[^>]+>([^<]+)<[^>]+>([^<]+)<[^>]+>([^<]+)<[^>]+>([^<]+)<[^>]+>([^<]+)<[^>]+>([^<]+)</td>
共有6组捕获, \1~\6 分别是 PHP 、"经典编程265例 "、PHP……