業種に適用される機械学習技術は様々です。データの特徴、予測ターゲットの属性、ビジネスKPIによって適用される機械学習技術とモデル開発プロセスが異なります。この記事では、金融業における機械学習にの適応方法についての具体例を紹介します。
【目次】
・フィンテックにおける機械学習の適用
・「どの顧客を承認し、どの顧客を断るのか?」 審査を高度化せよ!
・アンダーライティング予測モデル
・CSS(Credit Scoring System)不渡り率予測モデル
・まとめ
・KPI-Driven Modelingを実現する「DAVinCI LABS」
フィンテックにおける機械学習の適用
フィンテックという概念と共に、金融業での人工知能技術の活用が話題になってから、すでに相当な時間が経ちました。
フィンテックという言葉が流行り始めた初期には企業が機械学習を導入してビジネス成果を出せるかに焦点がありましたが、現在では、より爆発的に増加した金融データと高度化された機械学習技術の組み合わせで成果を最大化するための戦略立案が中心的なテーマとなっています。さらに、激しくなった金融市場で競争優位を先取りするための技術競争の源泉のひとつと考えられています。
よく知られているように、金融業界での機械学習の活用はマーケティングおよびセールス、投資管理、リスク管理、ターゲット顧客セグメント、自動化サービス、詐欺探知、信用審査など様々な業務にわたっています。「機械学習 金融 活用事例」というキーワードで資料を探してみると、簡単に見つけ出すことができます。
「どの顧客を承認し、どの顧客を断るのか?」 審査を高度化せよ!
保険審査やローン審査のように商品を購入、加入、貸出しようとする顧客を対象に行う審査業務は、内部的に蓄積された経験とルールシステムの運営で行われます。 このような審査業務とはそれぞれの顧客が承認に値するのか、拒絶に値するのかを予測評価する業務でもあります。
機械学習では「予測モデリング」という方法があります。「予測モデリング」を用いて承認すべきか拒絶すべきかを顧客をデータ基盤に予測することができます。審査業務で機械学習が大きな効果を上げることができる理由は、数多くの顧客を管理する金融業では予測精度が1%上昇しただけでも損害額節減に大きな効果があるためです。
アンダーライティング予測モデル
ailysは計3年分の1千万件のデータを活用して、保険顧客会社とともに損害保険のアンダーライティング(保険における引き受け可否判断)予測モデルを開発した経験があります。 保険商品ごとに既存顧客データの事故率と事故の深刻度を計算してデータの変数に指定し、引受可否予測モデルの性能を高めるために事故当時の環境(天気、温度、湿度など)と事故車両の種類も考慮しました。その結果、従来の審査システムとは異なるモデルが開発されました。
<予測モデルの高度化のため、事故当時の環境と車両スペックを活用>
下の図は、新しく開発されたモデルの特徴を簡単に描写したものです。 赤い円は従来承認されていたお客様で、灰色の円は従来拒絶されていたお客様です。 しかし、ailysの予測モデルは赤色の四角形内部にいる顧客を承認し、そして灰色の四角形の内部にいる顧客は拒否するように予測しました。このように従来のシステムとは異なる予測をするようになったのです。
<マシンラーニング予測モデルのアンダーライティング結果>
機械学習が引き受けを承認したり拒絶したりする判断は、どのような理由からでしょうか?先ほど申し上げたように、アンダーライティング予測モデルでは保険商品の引受可否を予測ターゲットに指定しました。この時、引き受け可否に重要な影響を及ぼす変数には事故率と事故の深刻度がありますが、事故率と事故深度が高いからといって無条件に引き受けが拒否されるのではなく、この2つの予測ターゲットを土台に予想される損害額と保険加入時の利益金が考慮され最終的に保険買収が決定されます。保険引受基準によるリスクと利益金は、以下のグラフでより簡単に理解できます。
<保険引受リスクによる累積利益>
もしリスクを全く抱えたくなければ、すべてのお客様の引き取りを断ればいいのですが。それでは利益が全く生まれません。ある程度顧客獲得を増やしていけば、それに伴う保険金支給というリスクは上昇しますが、すべての顧客が事故を起こすわけではないため、利益が発生します。
そのうち、買収顧客数がある範囲を超えることになれば、利益は頂点に達し、再び減少し始めます。損害額を莫大に発生させる顧客まで引き取ってしまったからです。したがって、アンダーライティング予測モデルは単純に顧客毎の事故発生率と事故発生度を計算することで終わるのではなく、利益金を最大限多く発生させるためにどの程度の線で引き受けるのか断るべきかの基準を探さなければなりません。
つまり、単純に事故を起こすだろう、保険を解約するだろうという予測に終始するのではなく、利益の最大化というKPI達成を基準にモデルが開発されなければならないという意味です。このようなモデル開発方法論をKPI-DrivenModelingといいます。
上図からも分かるように、従来のモデルに比べてailysの「DaVinCI LABS」を用いて開発したモデルは、より高い利益を確保できる基準を提示することができ、これを通じて8億円程度の損害額削減効果がありました。このようにモデルの予測力が1%上昇しても、企業からみれば数億円の利益効果がでると言えます。
CSS(Credit Scoring System)不渡り率予測モデル
今度は、ailysが銀行の顧客と一緒に進めてきた信用評価モデル開発プロジェクトについてご紹介します。
信用評価業務で機械学習を活用する場合、特に中程度の信用顧客を対象に大きな効果を得ることができます。なぜなら、信用度が極度に高かったり低い顧客は、あえて機械学習を活用しなくても評価しやすいからです。既存の信用評価システムでも高信用顧客と低信用顧客はその特徴が明確なので選別は簡単です。
しかし信用等級が4~6等級程度の信用の顧客はその特徴が明確でないだけでなく貸出の審査基準に曖昧になりがちで判断が難しいです。 まさにここで機械学習によるモデリングの効果が発揮されます。
<既存モデルに対する機械学習モデルの追加による効果>
機械学習予測モデルでは、従来の貸出、延滞履歴、カード、残金、取引履歴などの財務情報と共に、顧客の非財務の情報まで一緒に考慮して貸出承認可否を判断します。 これにより、上図のように既存モデルでは発見できなかった追加融資潜在顧客を発掘することができるのです。実際、ailysとプロジェクトを進めた会社は、融資商品の承認率は40%以上向上し、不渡り率を50%以下に下げました。
CSS予測モデルでもKPIを中心としたモデル開発の方法論は非常に重要です。単に「貸出償還可否」を予測ターゲットに指定したモデルでは、実際に貸出償還可能性が何%以上であれば承認すべきかを判断することは困難です。融資返済の可能性が50%以上であれば、無条件に承認をした方がいいのか、あるいは60%でなければならないのか?
単に貸出償還確率を予測するだけでは、経営的に最も合理的な判断基準が何なのかがわからないのです。
貸出業務の最終目標は融資返済の可能性や不渡り率を正確に予測することではなく、融資を通じて得られる利益を最大化する目標が重要です。つまり、企業で重要なターゲット変数は貸出承認を通じて得られる利益金と未償還または延滞時に発生する損害額です。
したがって、融資返済の可能性とともに融資金額、延滞期間、追加融資の可能性などを考慮して、顧客別に承認した場合に予想される利益というKPIが基準にならなければならないのです。
まとめ
フィンテック業界において機械学習の導入がすすむにつれ、単なる予測モデルでは利益創出に必ずしも結びつかないことが明らかになってきました。そのために目標とするビジネス目標(KPI)に基づいた予測モデルを作成するKPI-Driven modelingというモデル作成の手法が重要となりつつあります。
KPI-Driven modelingを取り入れることにより、利益最大化に結び付く顧客審査や信用度の予測モデルを作成し、実際の業績改善に結び付けることが可能となります。
KPI-Driven Modelingを実現する「DAVinCI LABS」
「DAVinCI LABS」は上記のようなビジネス成果に基づくKPI-Driven Modelingを作成するために必要な分析機能(「教師あり学習」「時系列予測」「KPIに基づく最適化)と、実際のモデルを作成するための教育やコンサルティングをパッケージにしたオールインワンのソリューションです。KPI-Driven Modelingに興味があれば是非一度お問い合わせください。
コメント