HÀNH TRÌNH GIẢI QUYẾT BÀI TOÁN DỮ LIỆU - BÀI HỌC ĐẮT GIÁ CHO MỌI NHÀ CUNG ỨNG
Trong môi trường kinh doanh MRO, các nhà cung ứng phải xử lý hàng trăm, thậm chí hàng nghìn mã hàng mỗi ngày từ nhiều đối tác khác nhau. Điều này dẫn đến những thách thức trong việc quản lý dữ liệu và xác định mức độ tương đồng giữa các bộ dữ liệu từ khách hàng và nhà cung ứng.
Thuật toán tương đồng dữ liệu áp dụng cho mảng mua hàng MRO bắt đầu từ câu chuyện của Công ty H – chuyên kinh doanh mảng phụ tùng, vật tư thiết bị điện, cơ khí, vật tư tiêu hao.
Vào giữa năm 2022, tôi được mời tham dự một buổi họp báo ra mắt Công ty H – một công ty kinh doanh theo hình thức B2B chuyên về mảng phụ tùng, vật tư tiêu hao. Công ty này tuy mới thành lập nhưng cũng khá “đình đám” vì họ được một số quỹ đầu tư quốc tế rót vốn vào. Với tham vọng đẫn đầu thị trường cung cấp vật tư, thiết bị cho các doanh nghiệp lớn như Pepsi, Toshiba, Coca Cola, Heineken…họ đã hợp tác với hơn 400 doanh nghiệp là các nhà cung cấp vói quy mô toàn cầu như Schneider Electric, Bosch, Honeywell, 3M… và cung ứng hơn 500.000 mặt hàng, hơn 20 ngành hàng đa chủng loại từ máy móc công nghiệp, thiết bị và phụ tùng điện, các dụng cụ cầm tay, đèn Led, thiết bị và dụng cụ kho xưởng, phụ kiện ngành gỗ, nội thất, xây dựng, máy móc và vật tư ngành may, văn phòng phẩm và thiết bị văn phòng.
Khi đó, tôi có đặt câu hỏi cho đội ngũ dữ liệu và sourcing (tìm nguồn cung ứng) của Công ty H về vấn đề quản lý dữ liệu đầu vào và đầu ra liên quan đến mô tả vật tư trong tình huống như sau:
- Xét thấy hàng ngày Công ty H sẽ nhận khá nhiều yêu cầu chào giá từ các đối tác của họ (khoảng hơn 1000 mặt hàng) – được gửi bằng Excel, không có quy chuẩn chung (dĩ nhiên vì mỗi khác hàng mỗi quy tắc đặt tên vật tư khác nhau).
- Và Công ty H sẽ gửi các yêu cầu này có ít nhất 10 nhà cung ứng khác nhau (vì phải tìm nhiều loại hàng hóa và nhiêu nguồn hàng khác nhau) – cũng gửi bằng Excel.
- Các nhà cung ứng nhận yêu cầu từ Công ty H và hồi đáp bằng bảng chào giá với mô tả vật tư theo quy chuẩn của họ (nhà cung ứng).
=> Kết quả: Công ty H phải so sánh, đối chiếu 2 luồng dữ liệu khác nhau (từ khách hàng và từ nhà cung ứng) với rất nhiều phiên bản để tìm ra đâu là hàng hóa phù hợp với nhu cầu khách hàng từ đó mới tạo được báo giá.
Vậy câu hỏi được đặt ra là: "Làm thế nào Công ty H có thể so sánh mức độ tương đồng dữ liệu giữa các luồng thông tin này (ví dụ: so sánh model, part-number, brand name….) – đây là bước cơ bản nhất trước khi đi vào các phân tích chuyên sâu và tối ưu hóa dữ liệu."
- Câu trả lời tại thời điểm đó là: “Bằng cơm!” Tức họ sẽ thuê một đội ngũ nhân viên mua hàng để so sánh, đối chiếu bằng Excel (hiển nhiên không hiệu quả với tình huống dữ liệu không giống nhau hoàn toàn) và bằng mắt thường. Khi đó, nhóm mua hàng của họ có khoảng 25 nhân viên! Một con số không hề nhỏ.
Tuy nhiên, khi được hỏi vấn đề này sẽ xử lý như thế nào, quả thật tôi không có câu trả lời thỏa đáng. Lúc đó, tôi chỉ có thể nói đến giải pháp là dùng AI để phân tích (giai đoạn đó AI cũng chưa bùng nổ như bây giờ). Lý do cho câu trả lời này là vì tôi có đang cộng tác với một vài bạn chuyên gia AI và khoa học dữ liệu, tôi cũng hy vọng các bạn tôi có thể giúp họ giải quyết bài toán này.
Cho đến cuối năm 2023, tôi tình cờ gặp lại bài toán này, và tôi đã dùng ChatGPT để hỏi một số thắc mắc (tôi tin là bạn cũng nên làm như tôi – cứ hỏi, cứ tò mò rồi sẽ ra vấn đề!). Và lúc đó, tôi cũng đã có ít nhất 02 năm tự học Python, cuối cùng tôi đã giải quyết bài toán với lập trình Python thông qua hai thuật toán Jaccard và Levenshtein. Và gần đây nhất, Microsoft đã chính thức release chức năng viết công thức python trực tiếp trong Excel 365, tôi lại có cơ hội áp dụng hai thuật toán này trực tiếp trên Excel (tuy nhiên nếu tính về năng suất thì không thể nhanh và xử lý nhiều dữ liệu như dùng Python trực tiếp được).
Giờ đây, tôi có thể chia sẻ với các bạn đang công tác trong lĩnh vực mua hàng (nhất là mảng MRO) nguyên lý và công cụ phân tích “độ tương đồng” dữ liệu, giúp các bạn làm sạch, tối ưu hóa quản lý dữ liệu mô tả vật tư, kiểm tra độ tương đồng vật tư giữa các nhà máy với nhau (thường thấy trong các tổ chức lớn – Heineken Việt Nam là một điển hình). Ngoài ra, thuật toán này có thể mở rộng để giúp các chuyên gia mua hàng phân tích tích lịch sử mua hàng (so với hiện tại) xem mức độ trùng lắp bao nhiêu (dựa trên mô tả công việc), ứng dụng trong các lĩnh vực mua hàng cho marketing, dịch vụ kỹ thuật.
Như đã đề cập ở trên, nếu bạn là nhà bán hàng (tương tư Công ty H), bạn có thấy công cụ phân tích này hữu ích trong việc quản lý dữ liệu mua/bán của bạn không? Tôi tin là có nhé!
Hẹn gặp các bạn trong buổi workshop chia sẻ thực tiễn về nguyên lý và công cụ này.
Ths. Nguyễn Minh Ngọc
Bài viết liên quan
TIN NỔI BẬT
Không tìm thấy dữ liệu