帮助将Beautifulsoop转换为Python脚本

您好,当我试图运行我的一个脚本,我有在它的编码中,我包括美丽汤,但当我运行脚本,美丽汤失败,谁能解释我做错了什么?
错误消息图片:

# 回答1


根据错误消息,您试图解析的HTML第2645行有一个无效的标记。我从未使用过Beautiful Soup,但根据文档,您也许能够在解析文档之前通过将构造函数传递给
标价按摩
争论。请参阅文档
这里

# 回答2


一种常见的Java模式是将元素直接插入到DOM中。为此,您会遇到许多这样的情况:"不正确的"编码脚本元素(例如,不使用CDATA,这是一种罕见的习惯,我完全反对)会导致解析器突然停止。修复方法很简单,将以下筛选器应用于源字符串:

选择 | 换行 | 行号
  1. import re
  2. re_script = re.compile("<script.*?>((?:.|\s)+?)</script>")
  3. out = re_script.sub("", source)

这将从源字符串中删除所有脚本标记。

标签: python

添加新评论