Ứng dụng học máy (Machine Learning) trong đánh giá tín dụng (Credit Scoring)

Nhiều tổ chức tài chính sử dụng các mô hình chấm điểm để giảm rủi ro trong đánh giá tín dụng cũng như trong việc cấp và giám sát tín dụng. Các mô hình chấm điểm tín dụng dựa trên các lý thuyết thống kê cổ điển được sử dụng rộng rãi. Tuy nhiên, các mô hình này không dùng được khi có số lượng lớn dữ liệu đầu vào. Điều này ảnh hưởng đến tính chính xác của dự báo dựa trên mô hình. Trong bài này, chúng tôi sẽ giải thích cách học máy (machine learning) có thể được sử dụng trong việc tính điểm tín dụng để đạt được độ chính xác cao hơn từ việc phân tích số lượng lớn dữ liệu.

Theo nhiều nghiên cứu thực nghiệm, các kỹ thuật học máy cùng với các thuật toán khai thác dữ liệu (data mining) khác dựa trên sự cách tính toán và chuyển đổi kiểu mới hoạt động tốt hơn cho mục đích dự báo. Các thuật toán học máy được thiết kế để học từ một lượng lớn dữ liệu lịch sử và sau đó tính toán ra kết quả dự báo. Lấy điểm tín dụng cho các khoản vay từ các ngân hàng bán lẻ làm ví dụ. Quá trình kinh doanh điển hình cho việc cung cấp dịch vụ cho vay là: nhận các hồ sơ vay vốn, đánh giá rủi ro tín dụng, ra quyết định về việc cho vay và giám sát việc hoàn trả vốn gốc và lãi.

Trong quá trình đó, các vấn đề có thể xảy ra, chẳng hạn như làm thế nào để đẩy nhanh tiến trình thẩm định tín dụng và làm thế nào để giám sát quá trình hoàn trả và thực hiện can thiệp kịp thời khi khả năng vỡ nợ xuất hiện.

Để giải quyết hai vấn đề nêu trên, chúng ta có thể xây dựng hai mô hình trong hai tiến trình khởi tạo vốn vay và tiến trình giám sát.

Trong quá trình khởi tạo, đối tượng cần kiểm tra bao gồm tất cả các ứng viên nộp đơn xin vay vốn. Mô hình có thể được sử dụng để phân tích và học thông qua dữ liệu lịch sử của các hồ sơ đăng ký vay vốn, qua đó đánh giá liệu một ứng viên mới có đủ tin cậy để được vay hay không nếu các chỉ tiêu đặc trưng của người nộp đơn được cung cấp, như thu nhập, tình trạng hôn nhân, tuổi, lịch sử tín dụng (chẳng hạn đã từng nợ xấu hay chưa), v.v.

Trong quá trình giám sát, hệ thống kiếm tra dữ liệu của người được duyệt vay vốn. Bằng cách sử dụng dữ liệu lịch sử hồ sơ hoàn trả và trạng thái đặc điểm của khách hàng đã hoàn thành toàn bộ quá trình vay vốn, chúng ta có thể đào tạo mô hình khác để đưa ra dự kiến về việc liệu khách hàng này có xác suất lớn hay không khả năng vỡ nợ; bằng cách quan sát hồ sơ hoàn trả của người nộp đơn cho một vài giai đoạn hoàn vốn đầu tiên và thay đổi các đặc tính, mô hình này sẽ giúp tạo ra các điều chỉnh mới dựa trên thông tin cập nhật. Quy trình tự động này hiệu quả hơn về thời gian xử lý cũng như tính chính xác so với cách làm truyền thống.

Tuy nhiên, có rất nhiều thuật toán học máy đang có sẵn, câu hỏi đặt ra là “Thuật toán nào là tốt nhất?”. Không có câu trả lời rõ ràng cho câu hỏi này vì tính hiệu quả của các thuật toán phụ thuộc vào dữ liệu và còn phụ thuộc vào cấu trúc dữ liệu cụ thể. Cách chung để tìm một mô hình thích hợp cho một bộ dữ liệu cụ thể hoặc một loại tập dữ liệu là áp dụng thuật toán đã được sử dụng rộng rãi và đã được kiểm chứng.

Trong hai tiến trình được nhắc tới ở trên, cả hai trông giống nhau nhưng có các mô hình khác nhau. Tiến trình giám sát hoàn trả trông tương tự như tiến trình cấp vốn vay, nhưng nó được học và đúc rút ra từ các dữ liệu lịch sử khác nhau, cụ thể là từ khách hàng cũ đã hoàn thành việc trả nợ, bao gồm toàn bộ lịch sử hồ sơ thanh toán và các đặc điểm của khách hàng. Một thuật toán học máy khác có thể được ứng dụng để phù hợp tương ứng với các thay đổi của cấu trúc dữ liệu.

Ngày nay, các thuật toán học máy hay được sử dụng nhất có thể được phân loại là phân loại đơn hoặc phân loại toàn bộ. Các đại diện của các thuật toán phân loại đơn là CART, Naïve Bayes, SVM, logistics. Việc sửa đổi các bộ phân loại đơn, nhiều mô hình cùng học để giải quyết cùng một vấn đề, được sử dụng rộng rãi, chẳng hạn như Random Forests, CART-Adaboost, v.v.

Về cơ bản, học máy cũng giống như việc dạy kiến thức tài chính cho một học sinh mới dựa trên số liệu lịch sử để thực hiện xác định chất lượng của khoản vay, sau đó anh ta sẽ có kinh nghiệm để tự quyết định. Nói rộng hơn, kỹ thuật học máy có thể được sử dụng trong tất cả các loại vấn đề phân loại. Nếu doanh nghiệp của bạn có vấn đề trong việc phân loại, tại sao bạn không thử áp dụng học máy để cải thiện tình hình?

Trong lĩnh vực ngân hàng/bảo hiểm, dựa trên Machine Learning chúng tôi phát triển các ứng dụng, bao gồm Xếp hạng tín dụng (Credit Scoring), Phân tích rủi ro (Risk Analytics), Phát hiện gian lận (Fraud Detection), Bán chéo (Cross-Sell).

Tìm hiểu ứng dụng Trí tuệ nhân tạo & Dữ liệu lớn vào hoạt động ngân hàng