• <small id='L3Y4K'></small><noframes id='L3Y4K'>

  • <i id='L3Y4K'><tr id='L3Y4K'><dt id='L3Y4K'><q id='L3Y4K'><span id='L3Y4K'><b id='L3Y4K'><form id='L3Y4K'><ins id='L3Y4K'></ins><ul id='L3Y4K'></ul><sub id='L3Y4K'></sub></form><legend id='L3Y4K'></legend><bdo id='L3Y4K'><pre id='L3Y4K'><center id='L3Y4K'></center></pre></bdo></b><th id='L3Y4K'></th></span></q></dt></tr></i><div id='L3Y4K'><tfoot id='L3Y4K'></tfoot><dl id='L3Y4K'><fieldset id='L3Y4K'></fieldset></dl></div>
    <legend id='L3Y4K'><style id='L3Y4K'><dir id='L3Y4K'><q id='L3Y4K'></q></dir></style></legend>

      • <bdo id='L3Y4K'></bdo><ul id='L3Y4K'></ul>
      <tfoot id='L3Y4K'></tfoot>

        如何将网页保存为文本文件 [Python]

        How to save web page as text file [Python](如何将网页保存为文本文件 [Python])
        1. <small id='LJWwb'></small><noframes id='LJWwb'>

          <legend id='LJWwb'><style id='LJWwb'><dir id='LJWwb'><q id='LJWwb'></q></dir></style></legend>

          1. <i id='LJWwb'><tr id='LJWwb'><dt id='LJWwb'><q id='LJWwb'><span id='LJWwb'><b id='LJWwb'><form id='LJWwb'><ins id='LJWwb'></ins><ul id='LJWwb'></ul><sub id='LJWwb'></sub></form><legend id='LJWwb'></legend><bdo id='LJWwb'><pre id='LJWwb'><center id='LJWwb'></center></pre></bdo></b><th id='LJWwb'></th></span></q></dt></tr></i><div id='LJWwb'><tfoot id='LJWwb'></tfoot><dl id='LJWwb'><fieldset id='LJWwb'></fieldset></dl></div>

            <tfoot id='LJWwb'></tfoot>
                <tbody id='LJWwb'></tbody>

                  <bdo id='LJWwb'></bdo><ul id='LJWwb'></ul>
                  本文介绍了如何将网页保存为文本文件 [Python]的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着跟版网的小编来一起学习吧!

                  问题描述

                  我想将网页(所有内容)保存为文本文件.(好像您确实右键单击网页 -> 另存为" -> 另存为文本文件",而不是作为 html 文件)

                  I would like to save a web page (all content) as a text file. (As if you did right click on webpage -> "Save Page As" -> "Save as text file" and not as html file)

                  我已尝试使用以下代码:

                  I have tried using the following code:

                  import urllib2
                  url=''
                  page = urllib2.urlopen(url)
                  page_content = page.read()
                  file = open('file_text.txt', 'w')
                  f.write(page_content)
                  f.close()
                  

                  我的目标是能够在没有 html 代码的情况下保存整个文本.(例如我想读è"而不是&eacute")

                  My goal is to be able to save a whole text without html code. (for example i would like read "è" instead "&eacute")

                  推荐答案

                  看看html2text如上所述其他地方

                  import urllib2
                  import html2text
                  url=''
                  page = urllib2.urlopen(url)
                  html_content = page.read()
                  rendered_content = html2text.html2text(html_content)
                  file = open('file_text.txt', 'w')
                  file.write(rendered_content)
                  file.close()
                  

                  这篇关于如何将网页保存为文本文件 [Python]的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持跟版网!

                  本站部分内容来源互联网,如果有图片或者内容侵犯了您的权益,请联系我们,我们会在确认后第一时间进行删除!

                  相关文档推荐

                  What happens when you compare 2 pandas Series(当你比较 2 个 pandas 系列时会发生什么)
                  Quickly find differences between two large text files(快速查找两个大文本文件之间的差异)
                  Python - Compare 2 files and output differences(Python - 比较 2 个文件和输出差异)
                  Why do comparisions between very large float values fail in python?(为什么在 python 中非常大的浮点值之间的比较会失败?)
                  Dictionary merge by updating but not overwriting if value exists(字典通过更新合并,但如果值存在则不覆盖)
                  Find entries of one text file in another file in python(在python中的另一个文件中查找一个文本文件的条目)
                  <i id='ViMBN'><tr id='ViMBN'><dt id='ViMBN'><q id='ViMBN'><span id='ViMBN'><b id='ViMBN'><form id='ViMBN'><ins id='ViMBN'></ins><ul id='ViMBN'></ul><sub id='ViMBN'></sub></form><legend id='ViMBN'></legend><bdo id='ViMBN'><pre id='ViMBN'><center id='ViMBN'></center></pre></bdo></b><th id='ViMBN'></th></span></q></dt></tr></i><div id='ViMBN'><tfoot id='ViMBN'></tfoot><dl id='ViMBN'><fieldset id='ViMBN'></fieldset></dl></div>
                    <bdo id='ViMBN'></bdo><ul id='ViMBN'></ul>

                  • <tfoot id='ViMBN'></tfoot>

                    <small id='ViMBN'></small><noframes id='ViMBN'>

                      <tbody id='ViMBN'></tbody>

                            <legend id='ViMBN'><style id='ViMBN'><dir id='ViMBN'><q id='ViMBN'></q></dir></style></legend>