MS Excel是一个处理大量表格数据的强大工具。它对于排序、分析、执行复杂的计算和可视化数据特别有用。在这篇文章中,草莓视频在线观看APP将讨论如何从网页中提取表格并以Excel格式存储。
第1步:转换为Pandas数据框架。Pandas是一个用于管理表格的Python库。草莓视频在线观看APP的第一步是将网页中的表存储到Pandas数据框中。函数read_html()返回一个数据帧的列表,每个元素代表网页中的一个表。在这里,草莓视频在线观看APP假设网页包含一个单一的表。
# Importing pandasimport pandas as pd # The webpage URL whose table we want to extracturl = "http://www.geeksforgeeks.org/extended-operators-in-relational-algebra/" # Assign the table data to a Pandas dataframetable = pd.read_html(url)[0] # Print the dataframeprint(table)输出
0 1 2 3 40 ROLL_NO NAME ADDRESS phones AGE1 1 RAM DELHI 9455123451 182 2 RAMESH GURGAON 9652431543 183 3 SUJIT ROHTAK 9156253131 204 4 SURESH DELHI 9156768971 18步骤2:将Pandas数据框架存储在一个excel文件中。为此,草莓视频在线观看APP使用Pandas的to_excel()函数,将文件名作为参数传递。
# Importing pandasimport pandas as pd # The webpage URL whose table we want to extracturl = "http://www.geeksforgeeks.org/extended-operators-in-relational-algebra/" # Assign the table data to a Pandas dataframetable = pd.read_html(url)[0] # Store the dataframe in Excel filetable.to_excel("data.xlsx")输出:
如果网页上有多个表,草莓视频在线观看APP可以将索引号从0改为所需表的索引。
