这是一个创建于 1429 天前的主题,其中的信息可能已经有所发展或是发生改变。
如何将数据从 Pandas DataFrame 写入 HTML 文件,今天番茄加速就来讲一下。
读取 HTML
我们可以使用 read_html ()函数读取 HTML 文件的表。此函数将 HTML 文件的表作为 Pandas DataFrames 读取。它可以从文件或 URL 中读取。
从文件中读取 HTML 数据
本文中,我们将使用一组输入数据。一个包含编程语言及其创建年份的表。另一个表中有土地面积及其成本(美元)。
将以下 HTML 内容保存在名为 table_data.html 的文件中:
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Table Data</title>
</head>
<body>
<table>
<thead>
<tr>
<th>Programming Language</th>
<th>Creator</th>
<th>Year</th>
</tr>
</thead>
<tbody>
<tr>
<td>C</td>
<td>Dennis Ritchie</td>
<td>1972</td>
</tr>
<tr>
<td>Python</td>
<td>Guido Van Rossum</td>
<td>1989</td>
</tr>
<tr>
<td>Ruby</td>
<td>Yukihiro Matsumoto</td>
<td>1995</td>
</tr>
</tbody>
</table>
<table>
<thead>
<tr>
<th>
Area (sq.ft)
</th>
<th>
Price (USD)
</th>
</tr>
</thead>
<tbody>
<tr>
<td>
12000
</td>
<td>
500
</td>
</tr>
<tr>
<td>
32000
</td>
<td>
700
</td>
</tr>
</tbody>
</table>
</body>
</html>
Pandas 需要另一个名为 lxml 的库的帮助来解析 HTML 和 XML 文件。为了使 read_html ()函数正常工作,您需要安装 lxml:
$ pip install lxml
一旦安装了 lmxl,我们就可以使用 read_html ()函数。它返回一个 DataFrames 列表,其中每个 DataFrame 是给定 HTML 文件的整个表元素。我们通过索引列表将每个表作为 DataFrame 进行读取。