如何用正则表达式排除HTML代码中中文加冒号的字符串？

正则表达式：排除中文加冒号格式字符串

匹配 html 代码中两个

标签之间内容时，遇到中文加冒号的格式（如：“张无忌：”)，传统正则表达式会把这些内容也匹配到，导致结果不符合预期。

为了排除中文加冒号格式字符串，我们可以使用负向前瞻断言，即：preg_match_all(‘/

(?!.*[x{4e00}-x{9fa5}：]).*/u’, $input, $matches);: 匹配标签开始符(?!.*[x{4e00}-x{9fa5}：]).*: 负向前瞻断言，确保其后没有中文加冒号的子串: 匹配标签结束符

示例：

$input = ‘<td>我是张三分</td><td>张无忌: 你真的是张三分？</td>’;preg_match_all(‘/<td>(?!.*[x{4e00}-x{9fa5}：]).*</td>/u’, $input, $matches);print_r($matches[0]);

输出：

Array( [0] => <td>我是张三分</td>)

如你所见，符合条件的只有没有中文加冒号的字符串。

以上就是如何用正则表达式排除HTML代码中中文加冒号的字符串？的详细内容，更多请关注范的资源库其它相关文章！