В этом гайде мы рассмотрим возможность конвертации HTML в Markdown разметку с помощью Python. Мы будем использовать пару удобных библиотек.
Первый способ с помощью библиотеки html2markdown. Установим с помощью следующей команды: pip install html2markdown
Пример:
import html2markdown
html = '''
<h1>Как конвертировать HTML в Markdown?</h1>
<p>На самом деле, это несложно благодаря <strong>библиотекам!</strong></p>
<h2>Импортируем библиотеку</h2>
<pre><code>import html2markdown</code></pre>
'''
convertation = html2markdown.convert(html)
print(convertation)
Результат:
# Как конвертировать HTML в Markdown?
На самом деле, это несложно благодаря __библиотекам!__
## Импортируем библиотеку
import html2markdown
Второй способ с помощью библиотеки markdownify. Установим с помощью следующей команды: pip install markdownify
Пример:
import markdownify
html = '''
<h1> Как конвертировать HTML в Markdown?</h1>
<p> На самом деле, это несложно благодаря <strong>библиотекам!</strong></p>
<h2>Импортируем библиотеку</h2>
<pre><code>import markdownify</code></pre>
'''
convertation = markdownify.markdownify(html, heading_style="ATX")
print(convertation)
Результат:
# Как конвертировать HTML в Markdown?
На самом деле, это несложно благодаря **библиотекам!**
## Импортируем библиотеку
```
import markdownify
```
Мы также можем конвертировать целые файлы HTML.
import markdownify
with open('text.html', 'r', encoding='UTF-8') as file:
convertation = markdownify.markdownify(file.read(), heading_style="ATX")
with open('readme.md', 'w', encoding='UTF-8') as file:
file.write(convertation)
Результат:
