2025年01月17日

爬取小红书相关数据导入到excel

本期我们来进行实战，爬取小红书的相关数据导入到excel中，后续可进行些数据分析，今后或者已经在运营小红书的小伙伴应该比较喜欢这些数据。今天我们的主角是DrissionPage，相对于之前介绍的selenium省去了很多的配置，直接安装了就能使用。

2025年01月17日

3个最受欢迎的表格数据提取开发包

本文深入探讨了从表格中提取数据的微妙世界，这项任务比提取纯文本要复杂得多。这种复杂性源于表格中经常出现的非常规结构，尤其是在研究论文中。与标准表格不同，这些表格可能没有清晰的界定，或者列标题和内容之间可能存在错位。这种半结构化表格对传统的提取方法提出了挑战，需要更高级的方法。

2025年01月17日

如何将亿行数据的Excel文件导入Mysql数据库

最近有位老铁，他手头上有四百多个Excel文件，每个文件的记录数都达到百万行左右，他很苦恼，因为想把这些文件都合并到一起，但Excel最大的记录数是1048576，他没有办法，所以咨询我，看有什么方法可以做到把这些记录都合并到一起。

2025年01月17日

像学Excel 一样学 Pandas系列-导入篇

可以这么说吧，离了 Pandas，我基本就没法做数据分析了。

2025年01月17日

如何将 JSON 文件转换Excel，做为高手的你一定要会哦!

2025年01月17日

Python中操作Excel的全面指南

在Python中操作Excel时，有几个广泛使用的库可以帮助处理电子表格数据。在这篇博客文章中，将介绍一些常用的库和它们的方法，以及一些示例代码，以便更全面地了解如何使用它们进行Excel数据处理。

2025年01月17日

pandas大法好:轻松驾驭Excel，数据分析不再难!

经常要捣鼓excel的小伙伴们，你们有福了，今天就来介绍下pandas这个强大、开源的数据分析处理工具，直接以“例”服人，没有多余废话，直接就能上手开干。也希望本文能够起到抛砖引玉的作用，让被excel表格处理缠身的你从此着迷pandas，掌握pandas大法可以从此让你高效工作，“人生苦短，我用pandas”。

2025年01月17日

Python之Pandas使用系列(八):读写Excel文件的各种技巧

介绍：

我们将学习如何使用Python操作Excel文件。我们将概述如何使用Pandas加载xlsx文件以及将电子表格写入Excel。

2025年01月17日

python合并excel工作表中的sheet页，第一列为索引，将某一列连接

import pandas as pd

# 设置工作簿路径
file_path = 'excel_file.xlsx'

# 创建一个空的DataFrame用于存储合并后的数据
merged_df = pd.DataFrame()

# 假设你要合并的列名为'YourColumn'
column_to_merge = 'ColumnToJoin'

# 假设所有的Sheet页都在第一个工作表中
sheets = ['Sheet1', 'Sheet2', 'Sheet3','Sheet4'] # 填入所有Sheet页的名称

# 遍历所有的Sheet页，并合并它们
for sheet in sheets:
df = pd.read_excel(file_path, sheet_name=sheet, index_col=0)
df = df[column_to_merge]
merged_df = pd.concat([merged_df, df], axis=1)

# 重置合并后的DataFrame的列名
merged_df.columns = sheets

# 保存合并后的DataFrame到新的Excel文件
merged_df.to_excel('merged_excel_file.xlsx', index=True)

2025年01月17日

5种常用格式的数据输出，手把手教你用Pandas实现

导读：任何原始格式的数据载入DataFrame后，都可以使用类似DataFrame.to_csv()的方法输出到相应格式的文件或者目标系统里。本文将介绍一些常用的数据输出目标格式。

四时宝库

程序员的知识宝库

爬取小红书相关数据导入到excel

3个最受欢迎的表格数据提取开发包

如何将亿行数据的Excel文件导入Mysql数据库

像学Excel 一样学 Pandas系列-导入篇

如何将 JSON 文件转换Excel，做为高手的你一定要会哦!

Python中操作Excel的全面指南

pandas大法好:轻松驾驭Excel，数据分析不再难!

Python之Pandas使用系列(八):读写Excel文件的各种技巧

介绍：

python合并excel工作表中的sheet页，第一列为索引，将某一列连接

5种常用格式的数据输出，手把手教你用Pandas实现