Dữ liệu ngân hàng được ví như “mỏ thông tin” quan trọng và giá trị. Với số lượng và dung lượng lớn, thể loại dữ liệu đa dạng và hàm chứa nhiều nội dung hữu ích… điều đó đặt ra vấn đề khai phá và chuyển hóa dữ liệu để ứng dụng và phục vụ cho hoạt động kinh doanh. VietinBank sớm phát hiện và đã bắt đầu sử dụng các công cụ để khai phá dữ liệu (Data Mining - DM) nhằm tối ưu hóa dữ liệu cho sự phát triển của mình.
Tiềm năng của DM
Xét về quy mô, VietinBank là một trong những ngân hàng sở hữu cơ sở dữ liệu lớn nhất trong các ngân hàng tại Việt Nam. Bên cạnh nền tảng dữ liệu và công nghệ đáp ứng các yêu cầu hiện tại cũng như nhu cầu phát triển và mở rộng trong tương lai, Dự án Kho dữ liệu doanh nghiệp (EDW) đang được triển khai còn góp phần hỗ trợ VietinBank nâng cao hoạt động quản lý. Trong đó có thể kể tới hiệu quả trong việc giám sát và quản trị rủi ro theo tiêu chuẩn quốc tế, cung cấp đủ lượng thông tin, dữ liệu cần thiết phục vụ cho các mô hình phân tích, dự báo như: Đánh giá hành vi khách hàng, các mô hình dự đoán, cảnh báo rủi ro...
Trong quá trình hoạt động, dữ liệu của ngân hàng phát sinh ngày càng nhiều. Do vậy, VietinBank cần sử dụng các nguồn dữ liệu này một cách hiệu quả nhằm phục vụ cho công tác quản trị điều hành, quản trị rủi ro, hỗ trợ ra quyết định và hoạch định chiến lược kinh doanh. Công cụ DM đang được VietinBank nghiên cứu và đưa vào sử dụng, phục vụ việc phân khúc khách hàng và lợi nhuận, chấm điểm tín dụng và phê duyệt, quảng bá và bán sản phẩm, phát hiện các giao dịch gian lận…
Hiện nay, có một số kỹ thuật và các thuật toán DM đã được phát triển và sử dụng. Trong đó có các loại mô hình phân loại cơ bản sau: Phân loại theo Cây quyết định (Decision tree); phân loại Bayesian; mạng Neural; phân loại dựa trên sự kết hợp…
Một ứng dụng tiêu biểu của DM trong lĩnh vực ngân hàng là sử dụng kỹ thuật Cây quyết định vào giải quyết bài toán phân lớp. Cây quyết định có thể được sử dụng hoặc như là một phần trong các tiêu chí lựa chọn, hoặc để hỗ trợ việc sử dụng và lựa chọn dữ liệu cụ thể bên trong cấu trúc tổng thể.
Kỹ thuật Cây quyết định
Cây quyết định bắt đầu bằng một câu hỏi đơn giản có hai câu trả lời trở lên. Mỗi câu trả lời lại dẫn đến thêm một câu hỏi nữa, giúp phân loại hay nhận biết dữ liệu sao cho có thể phân loại dữ liệu hoặc có thể thực hiện dự báo trên cơ sở mỗi câu trả lời. Ví dụ: Từ mẫu dữ liệu gồm 1.000 khách hàng, từ các thuộc tính (độ tuổi, giới tính, tình trạng hôn nhân, nghề nghiệp, thu nhập, thời gian làm việc, nguồn trả nợ, xếp hạng tín dụng..) ngân hàng cần tìm câu trả lời: Sẽ quyết định giải ngân cho khách hàng thuộc nhóm thuộc tính nào?
Để trả lời câu hỏi trên, có thể sử dụng Giải pháp DB Lytix on Sybase IQ. Thuật toán xây dựng Cây quyết định trong DB Lytix bắt đầu bằng việc chọn mỗi biến đầu vào chưa được chọn trước đó và đo mức độ tinh khiết trong các kết quả ứng với mỗi biến. Một phép tách tốt nhất sẽ được sử dụng trong phép tách khởi đầu, để tạo 2 hay nhiều nút con. Nếu không phép phân tách nào có khả năng (có thể do quá ít bản ghi thỏa mãn) hoặc không làm tăng độ tinh khiết thì thuật toán kết thúc và nút đó trở thành nút lá.
Từ mẫu dữ liệu sẵn có, sau khi tham số hóa và chuyển đổi số liệu mẫu. Gọi các hàm tương ứng trong DB Lytix và chúng ta sẽ có được kết quả để đưa ra quyết định từ các yếu tố: Vốn tự có, xếp hạng tín dụng, thời gian kinh doanh, tổng thu nhập.
Với dự đoán đã thu được, khi phát sinh những khách hàng có thông tin như các lớp khách hàng đã được dự đoán, nhà quản trị sẽ dễ dàng ra được quyết định kinh doanh hoặc giúp giảm thiểu thời gian, chi phí khi thu nhỏ phạm vi để phục vụ công tác thanh tra kiểm tra…
Một giải pháp khác cũng đã được sử dụng trong Dự án EDW là SAP Business Object Lumira sẽ giúp cho các nhà quyết định có thể dự đoán được xu hướng kết quả của thông tin.
Khả năng dự báo trong SAP Lumira cho phép sử dụng dữ liệu lịch sử là cơ sở để dự đoán giá trị tương lai. Dự báo sử dụng phương pháp giải thuật được tích hợp sẵn trong công cụ như: Đường hồi quy tuyến tính (Linear Regression), dự báo trước (Forecast). Một phương pháp khác - phương pháp cân bằng mũ thì thể hiện số liệu một chiều thông tin trong đó chiều còn lại được phân cấp theo thời gian (tháng, quý, năm). Ví dụ: Với số liệu trong 12 tháng của năm 2014 tại một đơn vị kinh doanh, chúng ta có thể đưa ra được số liệu dự đoán về dư nợ nhóm 5 sẽ tăng giảm như thế nào của tháng kế tiếp (1/2015).
Với việc thực hiện Dự án EDW, VietinBank đang đi đúng xu hướng của một ngân hàng hiện đại trong xây dựng và khai thác kho dữ liệu. Nhiệm vụ tiếp theo là khai thác tính năng của hệ thống, đưa ra các bài toán phân tích, dự báo áp dụng linh hoạt và chính xác, để có được những sản phẩm làm tăng khả năng cạnh tranh, quyết định đúng đắn và phù hợp với chiến lược kinh doanh đã được hoạch định.
|
Khách hàng trải nghiệm dịch vụ của VietinBank |