рефераты

рефераты

 
 
рефераты рефераты

Меню

Статистический анализ банковской деятельности. Исследование моделей оценки кредитных рисков рефераты

Существуют различные подходы к определению кредитного риска частного заемщика, начиная с субъективных оценок специалистов банка и заканчивая автоматизированными системами оценки риска. Ми­ровой опыт показывает, что основанные на математических моделях системы являются более действенными и надежными. В целях построения модели кредитного риска сначала производится выборка клиентов кредитной организации, о которых уже известно, хорошими заемщиками они себя зарекомендовали или нет. Такая вы­борка может варьироваться от нескольких тысяч до сотен тысяч, что не является проблемой на Западе, где кредитный портфель компаний может состоять из десятков миллионов клиентов. Выборка содержит информацию по двум группам кредитов, имевшим место в деятельно­сти банка: «хорошим» и «плохим» (проблемным или невозвращенным).

Ниже выполнен анализ прозрачности скоринговых методик оценки кредитных рисков


1.2.          Характеристики физического лица. Структура данных


Кредиты физических лиц описываются 20 признаками, каждый их которых имеет градации (Таблица 1.)


Таблица 1. Описание кредита физического лица

Номер признака

Наименование признака

Обозначение

Число градаций

0

Успешность кредита

Y

2

1

Сумма счета в банке

Z1

4

2

Срок займа

Z2

10

3

Кредитная история

Z3

5

4

Назначение займа

Z4

11

5

Сумма займа

Z5

10

6

Счета по ценным бумагам

Z6

5

7

Продолжительность работы

Z7

5

8

Взнос в частичное погашение

Z8

4

9

Семейное положение и пол

Z9

4

10

Совместные обязательства или поручитель

Z10

3

11

Время проживания в данной местности

Z11

4

12

Вид гарантии

Z12

4

13

Возраст

Z13

5

14

Наличие других займов

Z14

3

15

Наличие жилой площади

Z15

3

16

Количество займов с банком

Z16

4

17

Профессия

Z17

4

18

Число родственников на иждивении

Z18

2

19

Наличие телефона

Z19

2

20

Иностранный или местный житель

Z20

2


Таблица данных имеет вид


Таблица2. Структура статистических данных


В работе используются реальные данные. Всего 1000 наблюдений. 700 заемщиков не вернули кредит «1», 300 – вернули «0».


Глава 2. Статистические и эконометрические методы оценки риска


В банках используются, главным образом, следующие методики:

·                    Скоринговые методики;

·                    Кластерный анализ;

·                    Дискриминантный анализ;

·                    Дерево классификаций;

·                    Нейронные сети;

·                    Технологии Data mining;

·                    Линейная вероятностная регрессионная модель;

·                    Logit-анализ;

Приступим к описанию этих методик.


2.1. Скоринговые методики


Скоринг кредитов физических лиц представляет собой методику оценки качества заемщика, основанную на различных характеристиках клиентов, таких как доход, возраст, семейное положение, профессия и др. В результате анализа переменных получают интегрированный показатель, который оценивает степень кредитоспособности заемщика по ранговой шкале: «хороший» или «плохой». Дается ответ на вопрос, вернет заемщик кредит или нет? Качество заемщика оценивается опре­деленными баллами, отражающими степень его кредитоспособности. В зависимости от балльной оценки принимается решение о выдаче кре­дита и его лимитах [4].

Привлечение банками для оценки кредитоспособности квалифици­рованных специалистов имеет несколько недостатков: во-первых, их мнение все же субъективно; во-вторых, люди не могут оперативно об­рабатывать большие объемы информации; в-третьих, оплата хороших специалистов требует значительных расходов. Поэтому банки все боль­ше интересуются такими системами оценки риска, которые позволили бы минимизировать участие экспертов и влияние человеческого фак­тора на принятие решений.

Для оценки кредитного риска производится анализ кредитоспособ­ности заемщика, под которой понимается его способность полностью и в срок рассчитаться по своим долговым обязательствам. В соответ­ствии с таким определением основная задача скоринга заключается не только в том, чтобы выяснить, в состоянии клиент выплатить кредит или нет, но и в степени надежности и обязательности клиента.

Скоринг представляет собой математическую или статистическую модель, с помощью которой на основе кредитной истории «прошлых» клиентов банк пытается определить, насколько велика вероятность, что потенциальный заемщик вернет кредит в срок. Скоринг является методом классификации всей интересующей нас популяции на различ­ные группы, когда нам неизвестна характеристика, которая разделяет эти группы, но зато известны другие характеристики.

В западной банковской системе, когда человек обращается за кре­дитом, банк располагает следующей информацией для анализа: анкетой, которую заполняет заемщик; информацией на данного заемщика из кредитного бюро, в котором хранится кредитная история взрослого населения страны;  данными движения по счетам, если речь идет о клиенте банка.

Кредитные аналитики оперируют следующими понятиями: «харак­теристики-признаки» клиентов и «градации-значения», которые принимает признак. В анкете клиента характеристиками-признаками яв­ляются вопросы анкеты (возраст, семейное положение, профессия), а градациями-значениями— ответы на эти вопросы. В упрощенном виде скоринговая модель дает взвешенную сумму определенных характери­стик. В результате получают интегральный показатель (score); чем он выше, тем выше надежность клиента (табл.3.). Интегральный показатель каж­дого клиента сравнивается с неким заданным уровнем показателя. Ес­ли показатель выше этого уровня, то выдается кредит, если ниже этой линии, — нет.

Сложность в том, какие характеристики-признаки следует вклю­чать в модель и какие весовые коэффициенты должны им соответ­ствовать. Философия скоринга заключается не в поиске объяснений, почему этот человек не платит. Скоринг использует характеристики, которые наиболее тесно связаны с ненадежностью клиента. Неизвест­но, вернет ли данный заемщик кредит, но известно, что в прошлом люди этого возраста, этой профессии, с таким уровнем образования и числом иждивенцев кредит не возвращали (или возвращали).


Таблица 3. Скоринговая карта

Показатель

Значение

Баллы

Возраст

20 - 25

100


26 - 30

107


31 - 40

123


…………

…………..

Доход

1000 - 3000

130


3001 - 5000

145


5001 - 6000

160


…………

…………..


Среди преимуществ скоринговых систем западные банкиры указы­вают в первую очередь снижение уровня невозврата кредита. Далее отмечаются быстрота и беспристрастность в принятии решений, воз­можность эффективного управления кредитным портфелем, определе­ние оптимального соотношения между доходностью кредитных опера­ций и уровнем риска.


2.2. Кластерный анализ


Методы кластерного анализа позволяют разбить изучаемую совокупность объектов на группы однородных в некотором смысле объектов, называемых кластерами или классами. Иерархические и параллельные кластер-процедуры практически реализуемы лишь в задачах классификации не более нескольких десятков наблюдений. К решению задач с большим числом наблюдений (как в наших целях) применяют последовательные кластер-процедуры - это итерационные алгоритмы, на каждом шаге которых используется одно наблюдение (или небольшая часть исходных наблюдений) и результаты разбиения на предыдущем шаге. Идею этих процедур реализована в «SPSS» методе средних («K-Means Clustering») с заранее заданным числом  классов.

Алгоритм заключается в следующем: выбирается заданное число k- точек и на первом шаге эти точки рассматриваются как "центры" кластеров. Каждому кластеру соответствует один центр. Объекты распределяются по кластерам по такому принципу: каждый объект относится к кластеру с ближайшим к этому объекту центром. Таким образом, все объекты распределились по k кластерам. Затем заново вычисляются центры этих кластеров, которыми после этого момента считаются покоординатные средние кластеров. После этого опять перераспределяются объекты. Вычисление центров и перераспределение объектов происходит до тех пор, пока не стабилизируются центры.

Если данные понимать как точки в признаковом пространстве, то задача кластерного анализа формулируется как выделение "сгущений точек", разбиение совокупности на однородные подмножества объектов.

При проведении кластерного анализа обычно определяют расстояние на множестве объектов; алгоритмы кластерного анализа формулируют в терминах этих расстояний. Мер близости и расстояний между объектами существует великое множество. Их выбирают в зависимости от цели исследования. В частности, евклидово расстояние лучше использовать для количественных переменных, расстояние хи-квадрат - для исследования частотных таблиц, имеется множество мер для бинарных переменных.

Меры близости отличаются от расстояний тем, что они тем больше, чем более похожи объекты.







Пусть имеются два объекта X=(X1,…,Xm) и Y=(Y1,…,Ym). (табл.4. ) Используя эту запись для объектов, определить основные виды расстояний, используемых процедуре CLUSTER:

·                    Евклидово расстояние  (Euclidian distance).

·                    Квадрат евклидова расстояния (Squared Euclidian distance)

·                    Эвклидово расстояние и его квадрат целесообразно использовать для анализа количественных данных.

·                    Мера близости - коэффициент корреляции , где  и  компоненты стандартизованных векторов X и Y. Эту меру целесообразно использовать для выявления кластеров переменных, а не объектов. Расстояние хи-квадрат получается на основе таблицы сопряженности, составленной из объектов X и Y (таблица 4.), которые, предположительно, являются векторами частот. Здесь рассматриваются ожидаемые значения элементов, равные E(Xi)=X.*(Xi+Yi)/(X.+Y.) и E(Yi)=Y.*(Xi+Yi)/(X.+Y.), а расстояние хи-квадрят имеет вид корня из соответствующего показателя


.

·                    Расстояние Фи-квадрат является расстоянием хи-квадрат, нормированным "число объектов" в таблице сопряженности, представляемой строками X и Y, т.е. на корень квадратный из N=X.+Y. .

Кластерный анализ является описательной процедурой, он не позволяет сделать никаких статистических выводов, но дает возможность провести своеобразную разведку - изучить "структуру совокупности".

Проведем кластеризацию по всем 20 признакам и всем наблюдениям. В результате работы программы выводится таблица 5. (показана лишь ее часть)


Таблица 5. Cluster Membership

Case Number

Y

Cluster

Distance

…………

……

…………

822

0

0

2985,732

823

1

0

2996,715

824

0

0

3040,706

825

1

0

3054,689

826

0

0

3099,727

827

1

0

3108,674

828

Страницы: 1, 2, 3, 4


 © 2010 Все права защищены.