本課題是跨計算機和經濟學的綜合研究,是數據挖掘相關技術的實際應用。研究者將使用Python進行大數據分析,并深入了解機器學習和對美國信用體系。
風險管理風險控制是指風險管理者采取各種措施和方法,消滅或減少風險事件發生的各種可能性,或風險控制者減少風險事件發生時造成的損失。
在美國,很多人因為不充分或者不存在信用歷史而很難獲得貸款。更不幸地是,這類人群經常被不良貸所利用。
捷信集團(Home Credit)致力于能讓這類沒有銀行信用記錄人群獲得正面安全的貸款經歷。為了達到這個目的,捷信集團采用了大量豐富的數據—包括通信和交易信息—來預測客戶的還款能力。
捷信集團使用統計和機器學習的方法進行預測。這樣既能幫助確保有還款能力的客戶不會被拒絕貸款,也能確保成熟的貸款可以使客戶更成功。參與該課題的學生將和導師完成一個機器學習項目。本課題旨在運用最前沿的機器學習技術對捷信集團的海量數據進行分析和預測。
AI+X數據驅動型科研
AI+X數據驅動型科研是指使用人工智能(AI)算法,收集、處理、分析具體學科(X)的海量數據,并基于此進行預測,從而獲得科學發現的研究方法。與傳統的、基于實驗或邏輯推理的研究方式相比,AI+X數據驅動型科研可以借助AI算法強大的運算能力,高效地進行大數據分析,具有投入產出比高、適用范圍廣的優點。
AI+X數據驅動型科研已被廣泛地應用于各個領域,利用AI算法研究基因數據,從而進行早期的癌癥篩查便是其中一例。基因組與癌癥病患的數據千千萬萬,使用傳統的科研方式對其進行分析,工程量大、過程繁瑣,在客觀上難以實現。但借助AI算法這一便捷的工具,生命科學家便能夠以海量的患者的遺傳信息為基礎,建立數據庫,與過往的研究成果進行對照,快速、準確地在兩者中發現規律、建立聯系,從而使癌癥診斷的“標準化”成為可能。
本課題適合: 9-12 年級學生,有較強的邏輯思維和抽象思維能力:
英文: 1、具備基本的學術英語閱讀能力 2、接觸過英文寫作,能初步撰寫英文文章;
數學: 1、概率統計基礎知識; 2、線性回歸基礎知識; 3、線性代數基礎(行列式、矩陣運算等);
計算機: 1、Python編程基礎; 2、Numpy、Pandas、Matplotlib庫基礎。
? 2025. All Rights Reserved. 滬ICP備2023009024號-1