翻譯|行業(yè)資訊|編輯:吉煒煒|2025-09-02 09:46:28.217|閱讀 31 次
概述:處理 CSV 文件是數(shù)據(jù)分析師和開發(fā)人員的日常工作。使用 Aspose.Cells,您可以在 Pandas 中導(dǎo)入 CSV,同時(shí)確保更好的控制、可靠性以及與 Excel 格式的兼容性。在本篇教程中,您將逐步學(xué)習(xí)如何將 CSV 轉(zhuǎn)換為 Pandas、處理 Excel 文件以及將其導(dǎo)出到 Pandas DataFrame。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
處理 CSV 文件是數(shù)據(jù)分析師和開發(fā)人員的日常工作。如果您需要將 CSV 轉(zhuǎn)換為 Pandas DataFrame,Pandas 提供了直接read_csv()函數(shù),但有時(shí)您需要更強(qiáng)大的功能。這時(shí),Aspose.Cells for Python 就派上用場(chǎng)了。使用 Aspose.Cells,您可以在 Pandas 中導(dǎo)入 CSV,同時(shí)確保更好的控制、可靠性以及與 Excel 格式的兼容性。在本篇教程中,您將逐步學(xué)習(xí)如何將 CSV 轉(zhuǎn)換為 Pandas、處理 Excel 文件以及將其導(dǎo)出到 Pandas DataFrame。
加入Aspose技術(shù)交流QQ群(1041253375),與更多小伙伴一起探討提升開發(fā)技能。
Aspose.Cells for Python via .NET是一個(gè)功能強(qiáng)大的電子表格處理庫。它允許您以編程方式創(chuàng)建、讀取、編輯和轉(zhuǎn)換 Excel 和 CSV 文件,而無需 Microsoft Excel。在處理 CSV 到 Pandas 的轉(zhuǎn)換時(shí),Aspose.Cells 可以充當(dāng)原始 CSV 文件和結(jié)構(gòu)化 Pandas DataFrame 之間的可靠橋梁。
在運(yùn)行示例之前,請(qǐng)確保已安裝以下內(nèi)容:
pip install aspose-cells-python
pip install pandas
這兩個(gè)庫將允許您使用 Aspose.Cells 加載和處理 CSV/Excel 文件,然后將它們轉(zhuǎn)換為 Pandas DataFrames 進(jìn)行分析。
通過 .NET 為 Python 使用 Aspose.Cells → 用于讀取和處理 CSV/Excel 文件。
Pandas →用于構(gòu)建和分析 DataFrames。
在本節(jié)中,您將逐步了解使用 Aspose.Cells for Python 將 CSV 文件轉(zhuǎn)換為 Pandas DataFrame 的完整過程。每個(gè)步驟都分解為多個(gè)小任務(wù),方便您輕松掌握。首先,您將把 CSV 文件加載到工作簿中。提取其內(nèi)容并構(gòu)建 Pandas DataFrame。
讓我們首先將 CSV 文件加載到 Aspose.Cells 工作簿中。
import aspose.cells as ac # Load CSV file into Workbook csv_wb = ac.Workbook("data.csv") # Access the first worksheet (CSV loads as sheet) csv_ws = csv_wb.worksheets[0]
文件加載完成后,逐行提取其內(nèi)容。這將為數(shù)據(jù)轉(zhuǎn)換為 DataFrame 做好準(zhǔn)備。
cells = csv_ws.cells # Extract CSV data into Python list data = [] for row_idx in range(cells.min_data_row, cells.max_data_row + 1): row_data = [] for col_idx in range(cells.min_data_column, cells.max_data_column + 1): row_data.append(cells.get(row_idx, col_idx).value) data.append(row_data)
現(xiàn)在,將提取的列表轉(zhuǎn)換為 Pandas DataFrame。此步驟展示如何將 CSV 轉(zhuǎn)換為帶有適當(dāng)標(biāo)頭的 Pandas DataFrame。
import pandas as pd # Convert to Pandas DataFrame headers = data[0] # First row as header rows = data[1:] # Remaining rows as data df = pd.DataFrame(rows, columns=headers) print(df.head())
現(xiàn)在,您已成功使用 Aspose.Cells 將 CSV 轉(zhuǎn)換為 DataFrame Pandas。
通過這些步驟,您已經(jīng)了解了如何使用 Aspose.Cells 將 CSV 文件轉(zhuǎn)換為 Pandas DataFrame。接下來,讓我們探索如何處理 Excel 文件:首先將其保存為 CSV,然后將其加載到 Pandas 中。
有時(shí)您的數(shù)據(jù)是 Excel 格式(.xlsx 或 .xls),并且您想通過 CSV 將 Excel 轉(zhuǎn)換為 Pandas DataFrame。Aspose.Cells 可以實(shí)現(xiàn)無縫銜接。
按照以下步驟通過 CSV 文件將 Excel 轉(zhuǎn)換為 Pandas DataFrames:
以下代碼示例展示了如何在 Python 中將 Excel 轉(zhuǎn)換為 pandas DataFrame:
import aspose.cells as ac import pandas as pd # Load an Excel file excel_wb = ac.Workbook("PandasTest.xlsx") # Save Excel as CSV excel_wb.save("converted.csv", ac.SaveFormat.CSV) # Reload CSV with Aspose.Cells csv_wb = ac.Workbook("converted.csv") csv_ws = csv_wb.worksheets[0] # Extract data from CSV cells = csv_ws.cells data = [] for row_idx in range(cells.min_data_row, cells.max_data_row + 1): row_data = [] for col_idx in range(cells.min_data_column, cells.max_data_column + 1): row_data.append(cells.get(row_idx, col_idx).value) data.append(row_data) # Convert to Pandas DataFrame headers = data[0] rows = data[1:] df = pd.DataFrame(rows, columns=headers) # Show results print(df.head())輸出:
Product A Product B Period 0 50 160 Q1 1 100 32 Q2 2 170 50 Q3 3 300 40 Q4
對(duì)于非常大的數(shù)據(jù)集,Aspose.Cells 比普通的 Pandas 更能處理內(nèi)存。您甚至可以啟用內(nèi)存優(yōu)化。步驟與之前相同。唯一的變化是加載 CSV 文件LoadOptions并設(shè)置MEMORY_PREFERENCE為高效處理大文件。
以下代碼示例展示了如何在 Python 中將大型 CSV 文件轉(zhuǎn)換為 pandas DataFrame:
import aspose.cells as ac import pandas as pd # Load the large CSV file with Aspose.Cells options = ac.LoadOptions() options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE csv_wb = ac.Workbook("large_file.csv", options) csv_ws = workbook.worksheets[0] # Extract data from CSV cells = csv_ws.cells data = [] for row_idx in range(cells.min_data_row, cells.max_data_row + 1): row_data = [] for col_idx in range(cells.min_data_column, cells.max_data_column + 1): row_data.append(cells.get(row_idx, col_idx).value) data.append(row_data) # Convert to Pandas DataFrame headers = data[0] rows = data[1:] df = pd.DataFrame(rows, columns=headers) # Show results print(df.head())
在本指南中,您學(xué)習(xí)了如何將 CSV 文件直接加載到 Aspose.Cells 中并將其轉(zhuǎn)換為 Pandas DataFrames,以及如何在導(dǎo)入 Excel 文件之前將其保存為 CSV。Aspose.Cells 與 Pandas 結(jié)合使用,可為您提供更強(qiáng)大的控制力、性能和靈活性,使您的數(shù)據(jù)處理任務(wù)更加可靠且可擴(kuò)展。
————————————————————————————————————————
關(guān)于慧都科技:
慧都科技是專注軟件工程、智能制造、石油工程三大行業(yè)的數(shù)字化解決方案服務(wù)商。在軟件工程領(lǐng)域,我們提供開發(fā)控件、研發(fā)管理、代碼開發(fā)、部署運(yùn)維等軟件開發(fā)全鏈路所需的產(chǎn)品,提供正版授權(quán)采購、技術(shù)選型、個(gè)性化維保等服務(wù),幫助客戶實(shí)現(xiàn)技術(shù)合規(guī)、降本增效與風(fēng)險(xiǎn)可控。慧都科技Aspose在中國(guó)的官方授權(quán)代理商,提供Aspose系列產(chǎn)品免費(fèi)試用,咨詢,正版銷售等于一體的專業(yè)化服務(wù)。Aspose是文檔處理領(lǐng)域的優(yōu)秀產(chǎn)品,幫助企業(yè)高效構(gòu)建文檔處理的應(yīng)用程序。
下載|體驗(yàn)更多Aspose產(chǎn)品,請(qǐng)咨詢,或撥打產(chǎn)品熱線:023-68661681
加入Aspose技術(shù)交流QQ群(1041253375),與更多小伙伴一起探討提升開發(fā)技能。
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn
文章轉(zhuǎn)載自:慧都網(wǎng)