無論銀行還是郵局,海量的數據已法單單依靠人力進行操作分析。如何依靠計算機精確識別手寫數萬計的客戶票和快遞標簽,成為提高物流、金融行業效率的重要課題。機器學習在這個課題上大有可為。此課題以手寫數字數據,通過建立分類模型實現對這些數字的精確識別。
基于機器學習的手寫快遞單據自動識別
Automatic Handwritten Express Document Recognition Based on Machine Learning
在此過程中,學生將學習到基礎概率統計知識,以及參數優化的基本理論,并編程實踐兩三個不同的模型。在較總結不同模型的不同結果之后,學會積累模型判別的相關經驗,此課題的成果正在逐步應用到銀行單據和快遞訂單的自動識別中。
課程模塊一:預備課程
在教學過程正式開始前,有方學者會根據學生的具體情況提供數學、統計、英語學術論文寫作等預備課程。
課程模塊二:科研輔導
來自美國頂尖人工智能的機器學習科研團隊將在有方學者團隊的配合下,進行8-12周的科研輔導:
微積分、線性代數和概率統計入門;
學習 Python編程語言和相關的庫numpy, pandas, scikit-learn, matplotlib;
學習探索性數據分析(Explorative data analysis),并通過統計方法和可視化對金融數據進行分析
學習回歸分析(regression),對金融數據進行社交媒體效應的評估
學習幾種重要的自然語言處理和機器學習算法,提出初步的金融數據輿情情感分析;
課題驗收需要學生完成英文學術論文的寫作,并向科研團隊進行答辯。
指導速度可能因實際教學情況而異
課程模塊三:論文寫作&發表
在科研輔導結束后
項目導師將輔導學生完成論文寫作
協助學生完成論文在英文學術期刊上正式發表。
整個科研教學流程中,每一位學員都將有學術督導協助保障研究階段性作業和論文的進度,確保取得研究成果。
本課題適合: 9-12 年級學生
有一定的英語閱讀和寫作能力
有較強的邏輯思維和抽象思維能力
專業領域的零基礎學生,我們會提供相關的學術知識培訓。
統計學:矩陣的基本知識
計算機:Python編程基礎
? 2025. All Rights Reserved. 滬ICP備2023009024號-1