Ngày nay, việc sử dụng Excel vào công việc đã trở nên quá quen thuộc với các nhân viên văn phòng. Còn Python là một trong những ngôn ngữ lập trình phổ biến, đơn giản và dễ sử dụng nhất. Bạn đã từng nghĩ đến việc kết hợp ngôn ngữ lập trình Python và Excel hay chưa? hãy cùng ICANTECH khám phá những điều thú vị xung quanh việc kết hợp này nhé!
Cả Python và Excel đều là những công cụ xử lý dữ liệu phổ biến và có nhiều ưu điểm. Trước hết, chúng ta sẽ nói một chút về 2 công cụ này.
Python là một ngôn ngữ lập trình cấp cao, ra mắt phiên bản đầu tiên (0.9.0) vào năm 1991. Python ra đời khá muộn so với nhiều ngôn ngữ lập trình phổ biến khác như C hay C++ nên có nhiều tính năng cập nhật phù hợp với nhu cầu người dùng. Chính vì thế Python được đánh giá là dễ học, dễ nhớ với các câu lệnh đơn giản, mà lại có khả năng ứng dụng rộng rãi. Python rất linh hoạt, có khả năng mở rộng và kết hợp với các đoạn code bằng C hay C++.
Microsoft Excel là một chương trình bảng tính có sẵn trong gói phần mềm Microsoft Office. Excel được dùng để tạo ra các Worksheet (bảng tính) nhằm lưu trữ, sắp xếp và xử lý dữ liệu dưới dạng bảng (gồm cột và hàng). Đây là một trong những phần mềm được sử dụng nhiều nhất trên thế giới. Excel có các công cụ và chức năng mạnh mẽ, đáp ứng nhu cầu công việc của hầu hết các công ty, tổ chức trên toàn thế giới. Một số ưu điểm chính của Excel là giao diện thân thiện, dễ sử dụng, dễ tương tác. Đồng thời, Excel cũng tương thích tốt với nhiều ứng dụng, phần mềm khác. Tuy nhiên, nhược điểm của Excel là khó để xử lý dữ liệu khối lượng lớn, tiêu tốn nhiều thời gian làm việc.
Kết hợp Python và Excel sẽ là một cách giúp khai thác tối đa ưu điểm của 2 công cụ này. Đồng thời, hạn chế nhược điểm của chúng giúp bạn xử lý công việc nhanh chóng và hiệu quả hơn.
Lợi ích khi Lập trình Python với Excel và xử lý dữ liệu Excel bằng Python có thể kể đến như sau:
Hiện tại, tính năng sử dụng Python trong Excel sẽ chỉ có trong Microsoft 365. Stefan Kinnestrand, Giám đốc điều hành tại Microsoft, cho biết: “Giờ đây, bạn có thể thực hiện phân tích dữ liệu nâng cao ngay trong Excel quen thuộc bằng cách truy cập Python trực tiếp từ thanh công cụ trên Excel”. Ông này nói thêm: “Bằng cách sử dụng các trình kết nối và Power Query tích hợp sẵn của Excel, bạn có thể dễ dàng xử lý dữ liệu với Python trong quy trình làm việc của Excel.”
Như đã nói ở trên, đầu tiên bạn cần sử dụng phiên bản MS Excel 365 của Microsoft mới có thể kích hoạt được tính năng này. Tại thanh công cụ của Excel 365, bạn chọn tab Formulas -> chọn Insert Python -> Custom Python Formula. Sau khi hoàn thanh, bạn sẽ thấy Python đã hiển thị ra ngay ở thanh công cụ Excel để bạn thao tác.
Các phép tính Python có thể chạy trên Microsoft Cloud và kết quả được trả về dưới dạng bảng tính Excel. Người dùng có thể tạo các công thức, PivotTable và biểu đồ, tất cả đều dựa trên dữ liệu Python, với khả năng đưa vào các thư viện biểu đồ như Matplotlib và Seaborn để hiển thị trực quan như bản đồ nhiệt, biểu đồ violin và biểu đồ bầy đàn. Những điều này sẽ giúp cho công việc xử lý dữ liệu của bạn trở nên nhanh chóng và hiệu quả hơn rất nhiều.
Bạn có thể thêm các thư viện của Python vào Excel, theo hai bước như sau:
Trong Python, Openpyxl là thư viện cho phép người dùng đọc các file Excel và xử lý chúng. Framework này có thể giúp bạn viết hàm, định dạng bảng tính, tạo báo cáo và xây dựng biểu đồ trực tiếp bằng Python mà không cần phải mở ứng dụng Excel. Hơn nữa, Openpyxl cho phép người dùng lặp lại lệnh qua các bảng tính Excel khác nhau và thực hiện cùng một phân tích trên nhiều bộ dữ liệu cùng một lúc.
Để cài đặt Openpyxl, bạn chỉ cần mở dấu nhắc lệnh hoặc Powershell và gõ lệnh sau:
$pip install Openpyxl
Bạn sẽ thấy thông báo sau khi đã cài đặt thành công:
Sau khi cài đặt thư viện, bạn có thể bắt đầu xử lý các file workbook của Excel một cách dễ dàng, ví dụ mở một file dữ liệu sau:
import openpyxl
wb = openpyxl.load_workbook('icantech.xlsx')
Thông thường trong một workbook của Excel sẽ có nhiều sheet, để sử dụng sheet đầu tiên, bạn sử dụng câu lệnh sau:
ws = wb.active
Ví dụ, một thao tác xử lý đơn giản nhất là đếm tổng số hàng và cột của sheet đang xử lý, với câu lệnh đơn giản sau:
print('Tổng số hàng là: '+str(ws.max_row)+'. Và tổng số cột là: '+str(ws.max_column))
Kết quả bạn nhận được sẽ là:
Tổng số hàng là: xxxx . Và tổng số cột là: yyyy
Với xxxx và yyyy lần lượt là số cột và số hàng dữ liệu bên trong sheet đầu tiên của workbook: icantech.xlsx mà bạn đã gọi ra.
5. Lời Kết
Qua bài viết này, ICANTECH đã chia sẻ với bạn những kiến thức về lập trình Python cho Excel. Mặc dù Excel hay ython đều là những công cụ hữu ích trong việc xử lý dữ liệu. Tuy nhiên, không phải ai cũng biết cách kết hợp chúng để xử lý dữ liệu Excel bằng Python hiệu quả. Hi vọng rằng những chia sẻ của ICANTECH đã giúp bạn hiểu và biết cách sử dụng Python và Excel giúp nâng cao hiệu quả công việc của mình.
Nguồn ảnh: ICANTECH.