Thư viện data science

Dưới đây là một số thư viện cơ bản được sử dụng nhiều trong lĩnh vực data science. Và chắc chắn trong tương lai sẽ còn nhiều thư viện khác nữa giúp cho việc xây dựng ứng dụng trở nên ngày càng thuận tiện hơn. Hầu hết các thư viện có thể được cài đặt một cách dễ dàng bằng pip.

Nhắc lại: Pip là một công cụ được cài mặc định cùng python. Để cài thư viện bằng pip chỉ cần mở cmd đánh lệnh

pip install <tên thư viện>

  1. Thư viện hỗ trợ xử lý dữ liệu (data processing)
    a) numpy
    Thư viện giúp tạo đối tượng và các lệnh làm việc với mảng nhiều chiều
    Tham khảo: https://numpy.org/, https://docs.scipy.org/doc/numpy/, https://pypi.org/project/numpy/
    Cài đặt bằng pip: pip install numpy

    b) scipy
    Thư viện giúp thực hiện các phép toán đại số tuyến tính, ma trận, xử lý ảnh, chuyển đổi Fourier, tối ưu hóa…
    Tham khảo: https://www.scipy.org/, https://pypi.org/project/scipy/, https://docs.scipy.org/doc/scipy/reference/
    Cài đặt bằng pip: pip install scipy

    c) pandas
    Thư viện giúp làm việc với nhiều kiểu dữ liệu khác nhau, dữ liệu theo thời gian và cho phép thực nhiều phép toán phức tạp.
    Tham khảo: https://pandas.pydata.org/, https://pypi.org/project/pandas/
    Cài đặt bằng pip: pip install pandas

    d) beautifulsoup
    Thư viện giúp thu thập dữ liệu từ các website trên internet
    Tham khảo: https://www.crummy.com/software/BeautifulSoup/, https://pypi.org/project/beautifulsoup4/
    Cài đặt bằng pip: pip install beautifulsoup4

  2. Thư viện trực quan hóa (data visualization)
    a) matplotlib
    Thư viện giúp trình bày dữ liệu dạng đồ thị, biểu đồ,…
    Tham khảo: https://matplotlib.org/, https://pypi.org/project/matplotlib/
    Cài đặt bằng pip: pip install matplotlib

    b) seaborn
    Được xây dựng dựa trên matplotlib và tích hợp pandas
    Tham khảo: https://seaborn.pydata.org/, https://pypi.org/project/seaborn/
    Cài đặt bằng pip: pip install seaborn

  3. Thư viện hỗ trợ phân tích dữ liệu (data analysis)
    a) Statsmodels
    Thư viện thực hiện các phép toán thống kê
    Tham khảo: http://www.statsmodels.org/stable/index.html, https://pypi.org/project/statsmodels/
    Cài đặt bằng pip: pip install statsmodels
Design a site like this with WordPress.com
Get started