1. 磐创AI首页
  2. Medium

玉山人工智慧挑戰賽2021年夏季賽-中文影像辨識競賽心得與作法分享

使用建議:這是篇記錄�於詳細的分享,文章略長請斟酌�用。

竳賲éEURO GBçµ�競賽連çµ�

GitHub(é™Ageé™é:ŒçºŒæ.‘ç�†ä)GitHub

éEuro™æ‘çš“ç­³­³­Œä¨�æ˜é‡�­�800欧元培训字典”“ç·”é“�­ˆ袁ää­çš”­…(欧洲培训字典“ç·�æ˜é‡�­�800 EURO TRANSPORITION DICTIONARYè”ç»?¶ä»–é¡�別ã€�。除了上述模å�‹çš„任務,在競賽時需è¦�將模å�‹éƒ¨ç½²åœ¨SERVERä?

“ƒèˆ‡è»Ÿç”“

  • NVIDIA GeForece RTX 3060笔记本电脑GPU
  • 英特尔酷睿i7âuro“11375H 11
  • Python 3.8.8
  • PyTorch 1.8.1
  • 火炬视觉0.9.1
  • CoLab

§‰�è¨欧元

æœææ-‡ä¨»è­»�茅“�”�<?Šçš“?�šæ³?Œä?�會è?�è?ˆ?apièèè?ˆ?Œ­…?¶ä¸­æœƒå»¶ä¼¸å‡ºè¨±å¤šæ‰€èª¿æŸ¥é��çš„æ–‡ç�»ä»¥å�Šå�„å¼�資æº�,篇幅?…?會陓ä?Š­°ˆé-Euroè¨�è«-與ä»<çççü£¬\cn\cf1\f25 EUROUçš”æ-‡ç«Œæœ‰èˆˆè»GBè\cf1\f25 Gbè\cf1\f25 EUROUAL…å�¯ä»¥å†�é»�進å�»çœ‹ã€‚本文有許多å�ªæ˜¯æˆ‘們這次實作的經驗,部分是我們在賽後檢è¨�所å�šçš„調整也元?œ??EUROURE?‡íºŒ?…?¶ä¸­ä¹Ÿæœ‰è¨±å¤šæ˜¯éŒ¯èª¤æˆ–是å°�çµ�æ�œä¸�相關的嘗試,若有任何ç–�æ¼�請多多包æÓµ� 在åˆ�期看é��資料狀æ³�與了解本次任務,我們大概立下幾個åˆ�期方å�‘,以下也會按照??<§ˆ-çš“æ-»�‘äá†éeuro²è.Œíºš (1)(1)æ‰<§<>欧元²è“Œè³‡æ-™æ?…”ç�†aiºŒ­°‡è³‡æ-™­ˆªé™èª?ˆ-昑é‡�æ-­ˆ†é“�(?

(2)éEURO²è“Œè�”­�ç>Ageé-œè³‡æº�è‘�é>†æ­�«é-<æº�資æ-™è‘�é>†ãuro�è‰�è™·ç�†æ-»æ³·

(3)將模å�‹ä»»å‹™åˆ†ç‚ºã€Œåˆ†é¡�800é¡�ã€�,以å�Šå�¦å¤–處ç�†åˆ¤æ–·ä¸�在800é¡�內皓ãEUROUALŒ§…”»»-é‘�ãˆ袁ãeuro�

(1)資æ-™æ?…ç�†èˆ‡æ�»ç

這部分算是我覺得時間æˆ�本最高但相å°�能學到的部分較少的é�¢å�‘。這次雖然è¦�花ä¸�少時間進行資料的整ç�†ï¼Œä½†å…¶å¯¦ä¹Ÿèƒ½ç�†è§£æ¯”賽單ä½�的出發é»�,畢竟在實際MLçwork,å�ªæ˜¯é€™æ¬¡æˆ‘們需è¦�自己動手清“Production應ç”??±æ˜‘ä?EURO讚è�è™?ç�†éEURO™äº>脏兮兮的EUREç�†èeuroŒ­·²ãuro,

ˆä-‰è³‡æ-™çˆ†é“�

在拿到資料後,å�¯ä»¥ç™¼ç�¾æ¯�張圖片的å��稱為編號劊Label皈é‡�­°�ãeuroŒTraining Data dic.txtãeuro�çš“é”�­ˆ袁§»:ç»<資æ-™á-Œä¨­­»Scriptè‡?‡­œ-片ä?�ç…(脚本?脚本?§��ç??�“è‡??ˆ†é?�?ˆ?�應皔é??�?ˆ袁ãeuro? «ˆäºŒäº‰è³‡æ-™æ?…(‡æ-™æ?…)ç�† 我們在拿到å�Ÿå§‹è³‡æ–™æ™‚å�Ÿæœ¬è¦�逕自進行資料清ç�†ä²Œä²†ç™üç�¨­œ¨‘有­°‡è³‡æ-™çˆ†é“�皔情æ³�äax<æ³…ç�†çš„é��程會很沒有效ç�‡ï¼Œæ‰€ä»¥æ±ºå®šå…ˆçÓ“é��äcertŠèççš”§ˆ†é“�§Œè†�æorge…”ç�†ãeuro,

上圖為「勤�這個�別中的資料示�,�這張圖中�以觀察到最完�的�想狀�應該為編號15614的這張,而我們也發��始資料會有下�所�的狀�:

a.“ˆ†é”�錓–Œ­,ç??™Ÿ7357çš”ãEUROUREŒ­?ãEUROURE�è,«æ¨™è¨,ºããEUROUREŒ?˜ç·™­-è?Œç?,7505ãEUROUL,?,??EUROUALƒæ…?{##**$$}{##**$$

c.š§EUROUAL<æ-‡­-aienŒ§,389與2266號㲌­Œ…(欧洲),389與2266è™Ÿí²Œ­Œ…(法国)­�«æ­gbç­ºé“�­ˆ袁與腔(英国语版:#)¶ä»–ä¸�相關文字。這種狀æ³�我們會視情??Š?»?…?Šè™?ç�†è?†?œƒæ>??Š??»ç…©ã€‚但我們秉æŒ�è‘—å�ªè¦�我們都辨èª�ä¸�出來就一律刪æ�‰çš„準則。

§œ?æ�­ç‘,與æ?…ç�†è³‡æ–™çš„é��程中,我們也發ç�¾äº†å¹¾ç¨®ç‰¹æ€§ï¼š

a.圖片的字跡的�色�固定,通常是�色與黑色為主。

b.ä¸�å�ªæœ‰æ‰‹å¯«æ–‡å­—,也有å�¯èƒ½æœƒæœ‰å�°åˆ·çš„字體如上圖的389號ãeuro,

c.œ-片部­ˆ†æœƒãŒ…§�«ãeuroŒç‘…色框線ã€�,所以我們有特別å°�心在進行è£�切的處ç�†æ–¹å¼�時會特別ä¿�留這些框線,å›ç,ºæ“è³³æ™,有ó�‘èƒü仟會有æ�Œæ¨GBçˆóƒ�çš“­œ-片ãeuro,

E.§œ??…?完資料後,發ç�¾éƒ¨åˆ†é¡�別的圖片數é‡�會相å°�少很多,如有些é¡�別有超é��100­ç皓資æ-™ä²†æœ‰äº>�‘胲20~30­­·??�³ãEURONE,é>-ç”沒有摧ˆ°�­EURO<{�­ˆYORENჅ}<{##**$$}有§EUROUAL<ä²�æ·斧头Œä²†èEUROUREƒæ…“ˆ°æˆ-許œƒæœ‰Data Uniflance­·�锌躌我§EUROUAL’æ?º?šè�蜉?¥é¡�外的資料,這部分細節會留到下節說æ˜�。

(2)資æº�與è�ƒèuroƒè³‡æ-™è‘�é>†

身為一個機械系雙主修統計系的學生,在é��å�»å¯¦ç¿’以å�Šé€²è¡ŒSide项目çš„é��程中,我了解到è¦�快速å°�一個é-˜åŸŸæœ‰åŸºç¤�çš„èª�識以利後續進行模å�‹å»ºç«‹çš„方法,就是é€�é��大é‡�的資料è’�é>†èˆ‡é-±è®Euroç>Ageé-œæ-‡ç�»Œç…ˆçœ‹çœ‹æ˜¯ä¸�是有人有å�šé��相關的題目與ç和”究,以å�Šæœ‰å“ªäº›éƒ¨ä»½æ˜¯æˆ‘們å�¯ä»¥å�ƒè€ƒèˆ‡æ�¡ç”¨çš„。畢竟這是一個除了建模外還è¦�後續布署上線的任務,è¦�考慮皓æ˜èÓ�èã…”Pipeline,拿開æº�與ç�¾æˆ�çš„æ–¹å¼�來改良å�¯èƒ½æ˜¯åœ¨é�¢å°�時間壓力時最好的解法。以下會分é¡�別介紹我們所æ�¡ç”¨çš„å�„種資æº�。:ˆ°è²é‡ºéƒüéœEUROMERé�é�A我aka EUROUE’AUL®Œæˆ�çš“袁亚非

ˆä-<æº�資æ-™èˆ‡é>»è…??-é«“ç”?ç“Ÿ

由於æŸ�些é¡�別的資料相å°�少,在考慮è??�­­·§…(?å�»äº†è§£æˆ‘們有哪些é�¸æ“‡ã€‚發ç�¾é™¤äº†ä¸­åœ‹çš„çé“�­-資æ-™é”>†­ÓŒãºŒæˆ‘akeuro’­�šäº†äeué:>调查�有慓穭-{##**$$}{##”}¬é–‹æ‰‹å¯«è³‡æ–™é›†å¤–,我們也找到幾個全ç¹�體的資料集,並且也發ç�¾æœ‰äººä½¿ç”¨é›»è…?

至於æ¯�個é¡�別的資料數é‡�到底è¦�到多少æ‰�算多呢?我們å�ƒè€ƒäº†ä¸€äº›æ–‡ç�»ï¼Œå¾�以下的ç�“ç©­§�‘ä»袁ç™çç�á�”é?…到一定數é‡�後有邊際é��減的狀æ³�,我們自己的判斷是æ¯�個é¡�別若有200張樣本應該就會有還ä¸�錯的表ç�¾äº†ï¼Œè€Œé€™ä¹Ÿæˆ�為了我們è’�集資料的目標。的Œ‡æ?™?œ??�?EURO??œ-片é?�?ˆ袁?�?Š?

ğŸ“�:?uroœ我需要多少图像??uro�了解每个班级的样本大小如何影响自主野生动物监测中平衡设计的深度学习模型性能指标,Shahinfar等人。

a.é-<æº�資æ-™é>†

çÓ�髓資æ-™é>†aiºš

哎。免费Team的資料集跟我們的需求比較åƒ�,文字圖åƒ�以圖片的形å¼�儲存。這裡我們æ‰�發ç�¾å�Ÿä¾†é–‹æº�文字資料集有分Online與Offline?…©ç¨®é¡�別,就最簡單的ç�†è§£ä¾†çœ‹ï¼ŒOffline的資料集為整個「文字的影åƒ�ã€�資料;而Online則是儲存「文字的字跡ã€�資料,也å›和此若è¦�æ�¡ç”¨å°±æœƒå¤šä¸€å€‹å°‡å­—跡轉æ�›æˆ�圖片的步驟。

“”資æ-™é“>†íºš

‡æ-™é>†äŒæœ‰äº>è‡æ-™é>†æœƒâŒ…å�«éƒ¨åˆ†çš„ç¹�體文字資料,但經é��調查發ç�¾ä¸¦ä¸�是所有800­EUROU<é“�ó”ˆ袁ä¨çš“ç�锓?”? B.>»è…??-é«“ç”?ç“Ÿ

ğŸ“�:§ˆ©ç”¨é>»è…¦å­—å�‹å»ºç«‹å�·ç©�ç¥�經網絡之中文漢字模å�‹é€²è¡Œæ‰‹å¯«èˆ‡å�°åˆ·å­—體辨識,æ��育安-臺大工海所碩士論文利用電腦字å�‹å»ºç«‹å�·ç©�ç¥�經網絡之中文漢字模å�‹é€²è¡Œæ‰‹å¯«èˆ‡å�°åˆ·å­—體辨識,æ��育安-臺大工海所碩士論文

­�äceroŠç‘‡çš“ç©æˆ’­™üç�»Œè<袁èé�­�èŠç¨”ç·çš“ægb朑çŒé™äº†èeuroƒæ…”»GBæEURO’çEURO‘çTHANCE EURO ENGEARæ…“¨GbæEuro EURO’çTHE EURO®ä½¿ç”¨é¡�外的開æº�手寫資料外,或許也å�¯ä»¥è€ƒæ…»ä瓨>»è…¦å­—é«”å�»ç”¢ç”Ÿå­—體圖片。由於競賽的資料集中也有些許的å�°åˆ·å­—體,使用此種方法或許å�¯ä»¥å¢�åŠ和訓練樣本中å�°åˆ·å­—體的多樣性。使用的字體å�¯ä»¥æ�¡ç”¨å�„種字髼ã€�的字體,產生出來的會比較貼近實際上我們訓練集中的手寫字體。“ŒèeuroŒç”ç©Ÿæ��­ˆ­�­»袁é�ä擇ãeuroŒæ‰<­««é騻cfg; 至於如何用字體產生出圖片的é��程,主è¦�是使用Pillow(PIL)çEURO“图像函數產生。å�¯å�ƒè€ƒä»¥ä¸‹é€£çµ�有詳細的šãEURO, «ˆäºŒäº‰è‰�è™·ç�†èˆ‡数据增强 A.§‰�è™·ç�† 弗朗索瓦·弗朗索瓦·弗朗索瓦(我們èª�為,在å�šæ–‡å­—圖åƒ�辨識å•�題時,圖åƒ�的亮度ã€�å°�比度以å�Šæ‹�æ”�環境ä¸�å�Œçš„å›éƒ½æœƒå°�致æ¯�張圖片長相都ä¸�一樣,這些å›ä¸�應該影響最後的辨識çµ�æ�œï¼Œè€Œéœ€è¦�å°�å�Ÿå§‹çš)“資æ-™ó�šä?euroä:>?‰�è™?ç�†ãeuro,?�ƒèeuroƒä?©§EUROUAL<資æº�㺌我­EUROU’æ�“(EUROUAL<è³EUROU<è³DATAæ:Œƒ??ˆ†çš“æ-æ³·ãeuro,

§…¶ä¸­ï¼Œæˆ‘們除了將圖片縮放æˆ�一個統一的åƒ�ç´和大å°�,也將圖片都轉æˆ�黑白圖片,é�¿å…為圖片中如字跡é¡�色ä¸�å�Œä¹‹é¡�çš„å•�題而å°�çµ�æ�œæœ‰å½±éŸ¿ã€‚此外,我們也æ�¡ç”¨OTSUçš„ç�°åº¦äºŒå€¼åŒ–,濾除æ�‰å½±åƒ�中的ä¸�å¿…:OTSU AUTH>�è¦�資訊。下圖為「勤ã€�這個é¡�別在進行å‰�處ç�†å®Œå¾Œçš„çµ�æ�œã€‚

ä:<­­Œæˆ†æ��二­œ¨éEuro™èGB‘戒éEuro‘應該èeuroƒæ…(EURONE EUROèGB’HEURE EUROURE®æ<?…»-çš“é-<æ:�攓�<æˆ-昑è‡?Train aiãŒäӆ詩è’-­�š­‰�­ŒèƒŒæ™æˆ†é>,¨¨Œ­>ç,ºç,ººç用Otsué>-ç“»�æä»袁æ�‰ä?�æ…?cnécn?ˆ†é>,?è¦�資訊,但å�Œæ™‚也會å°�致æŸ�些é‡�è¦�的字跡特徵也被é��濾æ�‰äº†ï¼Œä½†é€™å€‹éƒ¨åˆ†å›ç,奥萨卡(…)ˆå‰�æ²’é�‡é��é¡�似的å•�é¡Œ(我們很è�œ),所以完å…?沑想é��ãeuro,­œ¨­«éeuro™ç’‡æ-‡ç«™,çœ<§ˆ°æœ‰æ…?(?¶ä»–人é‡�å°�這次比賽所å�šçš„å‰�後背景分離的方法,å�¯ä»¥å�ƒè€ƒçœ‹çœ‹ä¸‹é�¢é€£çµ�。 b.数据增强 圖片的多樣性,我們也æ�¡ç”¨äº†ä¸€äº›æ–¹æ³•ä¾†ç”Ÿæˆ�更多樣的資料(雖然事後分æ��我們æ�¡ç”¨çš„æŸ�些å�šæ³•æˆ–許會改變資料的分布狀æ³�而å°�致模å�‹è¨“練到的ä¸中的ç,ºäº†§,�ãŠ�昑â�Ÿ­§<皓資æ-™æˆ†­?ƒ)ãeuro,<燔賙æ-ˆ†­?ƒ)ãeuro, æ-³³·èå�¯å�ƒè€ƒä¸‹æ–¹é€£çµ�,圖片的範例å�ƒè€ƒè‡ªã€Œåˆ©ç”¨é›»è…代码ˆ‡¦å­—å�‹å»ºç«‹å�·ç©�ç¥�經網絡之中文漢字模å�‹é€²è¡Œæ‰‹å¯«èˆ‡å�°åˆ·å­—體辨識ã€�這篇論文。主è¦�æ�¡ç”¨OpenCV中的套件處ç�†ã€‚以下的方法å�¯ä»¥é€²è¡Œå�„種組å�ˆç“生äee�äcute EUROUALæ¨GBçš“çµ�æ�œãeuro,

(3)“�”–“œæ-‡ç�»è”–“Ÿ袁”

在這個部分,我們會介紹我們發ç�¾çš„相關資æº�以å�Šæ‰€çœ‹é��çš„ç和”究,分別會é‡�å°�「分é¡�800é¡�ã€�以å�Šåˆ¤æ–·ã€Œå…»»-é“�­ˆ袁ãeuro�çš”§…©§EURO<æ-�‘éEUROUAL²èŒè¨�è«-ãEURO, ˆä-euro‰800é“�ä-‡­-§ˆ†é”�­·�é“Œ 由於此次的任務是å�ªéœ€è¦�分é¡�圖片中的「單一文字ã€�而é��「一串文字ã€�,我們在Surgeryæ™,有ç™çç�á?euroä:>æ-泷會è��­…這種比較åƒ�是在解決辨識一串文字的å•�題,所以å�¯èƒ½ä¸�é�©å�ˆç”¨åœ¨æˆ‘們的任務上。-œçš“æ”�“Œ­ƒ�CRNN袁”(元RNN?

分é¡�的任務在å�šçš„事一樣,所以我們的想法是與å…、ŸImageNet、œ:抭é、�ŒImageNet�æœEUROLASŸ:ç�çš“æ�áæ§<æ…#…應該花的時間比較少準度也ä¸�會太差。囇?ˆå�ƒè€ƒä¸‹é�¢é€£çµ�在å�šå½±åƒ�分é¡�任務的Benchmark了解ç�¾æœ‰çš„å�„種模å�‹åœ¨æº–度與é�‹è¡Œæ•ˆç�‡çš„表ç�¾å¦‚何。Benchmark

éEURO™èGB‘戒§EUROUAL‘ä?�?�?èEUROUREƒæ…œ?ImageNetä??Šè??�çš“æ:?Ÿæœ‰èeuroƒæ…?æˆ�å•�題,所以在準確度與效ç�‡é–“勢必中的“�”š“�ƒæ·Ageé‡�ä-Œä–�昭>”-“-”˜œ-Fine-Tune皓蔓ˆ-昔œ服务器Šé�<è“Œæ™,«Œé��æ-cué�§š”§�ƒæ·Age郧œƒéEUROURE WITH EUROUAL WORLD VERVER“­�ƒæ·Age郧œƒéEUROURE FORM EUROURE FORMAL VERVER”FINTURE FORMAL“FINTIME TIMEçNAME”è“會有äax欧元ä:>权衡和欧元,

æœEUROUAQUEáŒæˆ‘SAURO EUROU’é�AUTO AUTOCATION†­ResneST(ResnetéEuleNetçŒ-版)與EfficentNet為主的模å�‹æ�¶æ§‹é€²è¡Œå˜—試。在決定好模å�‹å¾Œè¦�å�šçš„就是找到å°�應的é和�訓練模å�‹å�ƒæ•¸ä¾†è¨“練在自己的資料上,這裡æ�¨è–¦çµ¦å¤§å®¶ä¸‹é�¢å¹¾å€‹è³‡æº�,都是在ImageNet∇ˆ†é“�™è¨“ç·”‡ºä³†çš“PyTorchæ”�<é>†­�ˆç�ãeuro,ResNeSt EfficentNet

PyTorch官方æ��ä¾›é�©ç”¨æ–¼å�„種任務的模å�‹å�¯ä»¥é�¸ï¼Œå�¯ä»¥é�¸æ“‡Visionçš“é�Ageég…”把æ‰Euro有跟é>»è…¦è¦–覺有關的模å�‹åˆ—出來,但è¦�注æ„�的是裡é�¢é‚„有包“�”–“物体检测”–“�çš”–“�”–“Œäç甓–Šè?�è‡?

Torchvision昑PyTorch§®˜æ-»­­°�ä²?å�«ä»¥ä¸‹çš„幾個模å�‹ï¼Œå�¯ä»¥è§€å¯Ÿåˆ°é€™äº›éƒ½æ˜¯ç›¸å°�比較基ç¤�的模å�‹ã€‚

预训=真正的GBè‘è“EUROURE§…元?�<æ™,??�?�?è?欧元?…袁æ“�<çš”æ�á§<äŸæœƒè®EUROLAS…袁éan�訓ç·�ƒæ·斧头Œè�ä»袁è®EUROè…袁亚杰(Yonako…)�訓練後的å�ƒæ•¸ä¾†åˆ�始化模å�‹ï¼Œå†�å°�自己的任務進行FINTIMEãEUROURE,è<ƒæƒ³è‡ª?�é™è¨“ç·üéEURONE EUROURE<é�Ageér…”?ƒ??�? 火炬图像模型éEUROURE應該算是在本次競賽中我們比較常在使用的,å�¯ä»¥å¾�下圖發ç�¾è·Ÿä¸Šé�¢çš„TORCHVISION讀模å�‹çš„使用方å¼�很é¡�似。å�¯ä»¥ç”¨list_models­°™ç>‡ç>“‰�æ��äá>é�訔ç·�ƒæ·Ageçš“æ”�<§ˆ-§‡:EUROURE“<{##**$$}”{##**$$}、、�?--Œæœ‰ä:>?�<§�ƒæ?元??�<æ™,?‰?�ƒæ?œƒèŠ??ˆä…?Œóœ¨è®EUROURE SAGE…¥æ¨¡å�‹æ™‚å�¯ä»¥æ‰‹å‹•è¤‡è£½å�„個模å�‹å°�應到的網å�€ä½¿ç”¨IDMç­‰ä?‰ç??�†?™?�?‰ãeuro, 如上圖在官方文件中有æ��到,使用é和�訓ç·存储”�<æ™,㺌軺ºè­­­…调整大小?,:3x224x224è步驟。由於在å‰�é�¢é€²è¡Œåœ–片å‰�處ç�†æ™‚已經將圖片ç�°éš�處ç�†è½‰æˆ�單一ˆNormalize‰�‰EURONE有é†è>“‰�æ‰EUROUAL有én�è”?�<?ƒçæ˜é‡�??�ImageNetçš“rgb?œ-片?”rgb?rgb?欧罗Œè“ç·çš”㺌æ‰Euroä»袁æ“�<自甧˜‘æ­Œ…(欧元<è‡?ç“ç?˜??Œ…­�«3­EUROU)éEURO™çéƒç,ºç»”皓高éš�Frame(è‡-­-有é»�æƒ�˜ä»袁­‰�Keraç>??�æ?這種我覺得很基本的功能),有興趣的人å�¯ä»¥çŒä-Ÿæœ‰è-šPyTorchæœè:«œ‰çš“­ŠŸèƒü(ƒ�昑Early Stopping PyTorch芟胔­ƒ�昒Early Stopping PyTorchæ-æ-˜ä-‡ä-Callbackçš“­ŠŸèƒüªªæ˜�ãeol,即回调(回调))å�ƒè€ƒä»‹ç´¹ callback

­�ƒèuroƒä?Šæ–PyTorch Lightning aka®˜æ-çš“Transfer Learningæ-‡ä»Ó㲌é??…”迁移学习æ-EURO AUTHANNSAR?ˆ­œ¨­šç©©�<æ™,éœEUROMERè?�­…(EUROMELè,éœEUROMERè?�­…ˆ­º·§…袁æ“�<ée-�訔緓�ƒæ·斧头Œ­�‘ä»袁ç”(Listé…�??ŠChildçš“æ”�äClinoœ­�»é�?“‡è?�æ>æ�>æ�‰çš”LayerãEUROME,瓱æ-我§EURO’æ˜èé?�?‡éEUROURE™?EUROURE<?�訔緓”�,:�Ÿ§§<é>�訓緔�˜?800MENT FORWARDæ™,YOMENTŒ?>ˆ�FREAGEä1?1�é™ä:†æœEUROURE AUAY??Œä?EUROURE?š”æ‰EUROWARE有Layerçš“?�ƒæ·­œ?è??“ç·çš”æ™,?euro™ä?�è??�æ>?™äº>Layerçš“?�ƒæ?Transfer Learning

“œ�”“�蔓�ãEURO,

æ�袁ä?†æœƒé™“??Š?…?¶ä»–相關的實作連çµ�以å�Šæˆ‘們閱讀é��後文ç�»çš„節錄,有些å°�本次任務å�¯èƒ½æ²’有直æ�¥å¹«åŠ©ï¼Œä½†èƒ½è®“我們了解到å�Ÿä¾†åœ¨é›»è…?

a.æ‰<­-­ˆ†é“�­œæ-³(é™”代码)({##**$$}{#**$$}{#xA0} b.æ-‡ç�»Surveyç‘eule錓 ğŸ“�:用于手写汉字识别的可解释距离度量学习,董等。 ğŸ“�:卷积神经网络在手写体汉字识别中的应用,郭等。 ğŸ“�:一种改进的具有鉴别权值丢失的初始-重网手写汉字识别网络,陈等。 ğŸ“�:基于两级卷积神经网络的无旋转联机手写汉字识别,Li等。

ğŸ“�:用于手写汉字识别的深度匹配网络,Li等。

ğŸ“�:在印刷数据的指导下,通过探索独立于书写者的特征进行健壮的脱机手写字符识别,张等人。

ğŸ“�:手写体汉字识别的书写风格对抗网络,刘等。

ğŸ“�:印刷体汉字识别中零射学习的部首分析网络,张等。

ğŸ“�:DenseRAN用于脱机手写汉字识别,王等。

ğŸ“�:用于少镜头脱机手写汉字识别的部首聚合网络,王等。

ğŸ“�:一种基于变压器的部首汉字识别分析网络,杨等。

ˆäºŒäº‰§…»-é‘�§ˆ袁

由於此種é¡�別的資料,在訓練集並沒有給定,這å°�我們當時在實作兜‰é»�麻煩ä¸�太曉得è¦�æ€�麼處ç�†ã€‚一開始我們是æœ�圖片的异常检测(異常å�µæ¸¬)這個方å�‘å�»æ‰¾è³‡æ–™ï¼Œå¾Œä¾†ç™¼ç�¾ä¸€èˆ¬åœ¨CVå•�題上的異常å�µæ¸¬å•�題比較åƒ�是在處ç�†ç”¢ç·šä¸Šç‘•ç–µå½±åƒ�或是醫療中的腫瘤影åƒ�這é¡�çš„å•�é¡Œ(如上圖所示),跟我們的需求ä¸�太一樣。經é��更多的MEOMENT AUTURE SAVERATIONŒíºŒæˆ‘­™ç�á­�ä»袁æœ�Out-of-Distributed Detectionæˆ-昒Open-Set Recognitionçš“æ-»�‘æ�»æ‰í資æ-™ãeuro,ä»»袁äax<會§…ˆèªªæ˜�我們主è¦�使用的方法,並後續介紹有讀é��çš„å…»»-有èÓGB䲜泷ãeuro, a.�äç“? ğŸ“�:基于能量的离线检测,刘等。

Out-of-Distribution Detection方法除了作法ä¸�一樣外,目的都殊途å�Œæ­¸ï¼Œå¦‚上圖所示,就是è¦�å°‡in-Distributed(­,æœæ“œ?Training Dictionaryäš”é“�­ˆ袁)與Out-Out-Distributed(??�­œ?Training Dictionaryä­­çš”æ‰EURONSANœ‰æ-‡­–§1?±§ƒ�)?…(Out-Out-Distributed检测EURO-IN-DIXATION,æ,æEURO-TRANSPORD DICTIONARY?)è©è欧元…皓資æ-™akoˆ†­?ƒ?ˆ†é--Softmax�袁計ç®-SoftmaxèŒéEURO™èGB”�“”欧元Œ能源功能EURO�èˆç–‡:能源分值“(EUROURE EUROUALŒéEUROURE™èGB‘æ�’ç)欧元Œ能源功能EURO�èˆç®-‡:EURO Score SCORITEç”(EURO EUROUAL能源功能)EURO EURO™èOUALŒFunctionOf-Distributionè³³‡æ-™(­º�­­�­­,­œ-ako�³ä?ŠããŒFI(X)ç,ºFull Connected Layerè­­­‡ºÓŒTç,ºä?euro EUROUALç?�?»»袁è?š“è…?­�ƒæ·?温度缩放)ãEURONE,ASAŸ:æœüä?ŠäºŒçÓ“é��éEURO™æ¨GBçš”Energy Score計ç®-㺌䲜èEUROU…(能源分值?ˆç?Œä1?œèeumulu…æ��­ˆ°äManage�éœEUROMERè�ä»»··é“�­-蔓緔“±­�ä»\r\f25‡In-Distribution與Out-Out Out-…(分配中的分配中的元数据)超出分配范围的数据(Out-Out-Out)©ç³³‡æ-™ç–“çš”­ˆ†é-<ãuro, 我們é€�é��å‰�é�¢æ��到的開æº�資料與電è…文字影åƒ�來實驗測試,這裡在實驗時布直æ�¥æ‹¿å�–比賽æ��供的800é“為來自比賽官方的手寫資料本來就會跟我們Œç”Ÿæˆ�In-Distributed與Out-Out-Distributed文字影åƒ�來實驗測試,這裡在實驗時布直æ�¥æ‹¿å�–比賽æ��供的800铙䳆ç?ÓIn-Distributed資æ-™­�Ÿ­>†æ˜æ>è’�集到與生æˆ�的資料有差異,所以想先çœ<çœ<çœ?In-Distributed與Out-Distributedéƒüæ˜è†è‡?é-<æº�與瓟æˆ�資æ-™æ™,分发外检测çš”è“�ãeuro,In-Distributedçš”­³�‡§EUROUTE¨§§§,è�²œ?-10«ŒOut-Distributed§‰‡æ˜¨œ?8?©ç資æ-™æˆ†­?ƒæ¨™æº-§·®§ˆ§§Œ­…(™æ:--ˆæ-Œæ…?)©ç¨®åˆ†å¸ƒé–“會有滿大的é‡�疊,代表在我們é�‡åˆ°çš„ç‹€æ³�上,單純使用能源分值,“昑­­ˆé>GB­°‡§…©ç¨³³‡æ-™akaˆ†é-<ãeuro, ç,ºäº†è§GBæ??Šè??�é??ŒíºŒä1?œèeuro…loss(å¼�å­�如上),也就是在訓練分é¡�任務時,除了é€�é��œ‰æ��?‡:?�?ˆè?-Energyœ交叉熵损失?Œ??ˆ†?�æ?éˆè?�è�Œæ™,讓In-Distribution與Out-Out of-Distributed?…©ç¨³‡æ-™æœ¨Ó“é��訔çŒèƒüéEURO�é��Energy Score皓計ç®-æ>‘��è‡ç…©ç?‡æ³-™æˆ†­?ƒçš“§·??ˆ远距离Œ?>œƒè?Šæˆ�ä?euro<多任务学习??š”é��ç?Œæ‰?»»袁è?é的資料放進模å�‹è¨“練。很æ„�外的是,經é��這樣的方法改善,In-distributionçš“å·¦å�³ï¼Œæ¨™æº–差也會å°�很多。最後我們是é�¸å®šä¸€å€‹ˆ­‡Out of-Distributed†ç�‡‡Out-Out of-Distributed§Œ‰‡æ˜§œ?67 SATHRESHOLDäÓ†­ˆ­®šç-üéEUROURE™?67 SALE THRESHOLDäÓEUROUAL FORMANCE?-50AIAND OUTRAN OF-EURO OF-OF OF-EURONE™SAURO EUROURE?ˆæ-·æ˜?Out-Out-Of-Distributedçš“­œ-片ai²Œä»袁æœEurnç,çš”ç��æ�Ÿæœ,800 Cenovus 800é�­ˆ†é“�aiºŒ§�»ä}EUROURE<è™·ç�†Out-Out-Distribution DetectãEURO(EUROUL,EUROUD OUD OF-DISTION DIRECTãEURO,EUROUE)、EURO、EURO B.§…»»-æ-æ³·

模å�‹å�ªéœ€ç”¨åˆ°ä¸€é¡�的資料訓練,在訓練完後å�³å�¯å�µæ¸¬æ�¥ä¸‹ä¾†çš„資料是å�¦ä¾†è‡ªæ–¼è¨“ç·>一类分类器�、一类支持向量机�、†éŒéˆ†é、�«Œ­Ÿ:œ、Šæ‰Euro有One-Class分类法PyODä­ççš“§�”ç、一级分类器�、一级SVM�<†éeulo²è“Œ­ˆ†é”、�訌­Ÿ:œá?Šæ‰EUROUAL有One-Class分类器PyODä¨çççš“§�”ç?Šæ‰EUROUAL有One-Class分类器´æ™‚所使用的那é¡�資料。上圖為使用One-Classé‡�å°�è©�騙的異常å�µæ¸¬å»ºæ¨¡çš„示æ„�圖,在訓練的é��程中就是用正常的資料(來自800é“�皔資æ-™)䆻:§”¨é€™ç¨®æ–¹å¼�會有個主è¦�çš„å•�題為無法進行End-to-Endçš“è”ç·Œä»GBè--我§EUROU’éœEUROMERè?�è…é¡�的分é¡�模å�‹å¾Œï¼Œå†�將我們訓練好的模å�‹å‰�é�¢å¹¾å±¤ç•¶ä½œ单类分类模å�‹çš„訓練資料。經é��實驗後,此種方法表ç�¾é��常悲慈訌800œ特征提取器-800é�-800é“�èœ-片皔ç‰áœOne-Class分类器˜iurenŒägee�ako…·­,™èƒç有淈­ˆ†­‡ºæ˜­�é†è‡-800é“�é,”昑œ¨800é“�­-ãeuro,PyOD 上圖

C.æ-‡ç�»Surveyç‘eule錓

ğŸ“�:MOS:朝向大规模语义空间的非分布检测,黄等人。

這篇的想法我自己覺得滿有趣的,拿我們所é�‡åˆ°çš„å•�題舉例,如上圖所示,æ和ƒæ­、œ?–‡�??�Out-Distributed Detect??·�é?ŒíºŒèˆ‡?…(超分布检测?§GB決800é“�vs.…”¶ä»–é¡�這樣的å•�題,ä¸�如我們å�¯ä»¥å°‡800é“�­ˆ†çµ”«Œ­°‡§·�é“Œæ<†è§GBæˆ�­”š§EUROUAL<絓VS§…UsageUsage»-é“�皔話Decision Bouundaryçš“æ”,‘Œæ‡‰è©²œƒç>£¬ƒ­®Ó易ãEURO,

ççç‘EUROçš“§�šæ³·aiºŒé?…ˆéœEUROMERè?�ó…ˆå°‡æ‰€æœ‰é¡�別進行分組,分組的方å¼�有幾種é�¸æ“‡ï¼Œåƒ�是在ImageNet­�‘ä»袁äÓ�ç…§­­�­œ-片Labelçš“çŸ袁è-˜ç»äº:ˆæ‘�­EUROUAL<é”�­ˆ袁Animationæˆ-Geological仓ç”�çš“çµ”­ˆYOMENèº>ä1·œèEUROURE…Ÿæ��戭Œ­œ¨ˆ­šæ‡‰ç“(Š)�­˜­œ(欧元™ç)先验知识Œæ‰EUROURE(EURO)QUORITY KNOWORITY AILAFORY YOUFORY AILANCE(EURO EURO KNOWORITY YOUBY YOUBLISH YOF KNOWORY YOLANWARY YOUAL YOUMAND YOUFORY YOUFORY YOLANFORY YOUFORY YOUMAND YOUFORY YOKNOWARY YOUAL YOUAL KNOWORY YOLANCE

在æ¯�個é¡�別給定組別後,æ¯�個組別所包­�«çš“é”�­ˆcen㺌é™üº†ç“?群集§Œæ‰EUROMANCE?ˆ†é…�到的é¡�別外,æ¯�個組別都會å†�æ–°å¢�一é和…ãEUROŒOTHERãEUROURE�çš“é”�­ˆYOMENãEUROURE,ç·Óéén�æ“­EUROURE<牻šin-Distributionä­çš”­œ-片æ™,㺌é™éä了­Œ…­�«éEUROURE™­-æ­gbç:é“œ-æ­gbç:é”�§ˆ袁çš“çµ”§ˆ袁­-㺌­…(欧元欧元--GBç?Other這個é¡�別所輸出的分數應該都會很高,囘ç,:éEUROˆœ-çœ-çš“Label札-ç�挅”Other Labelç,:éEURO EURO AUAL AUTON-çš“Label札-ç�挅§�«­œ¨§…ää»-絓§ˆ袁ã…§>“Out-of-DistributedŒç·ÓOut of-Distributed”š“­œ-片­‡:ç�á™,㺌應該‰EURONE有甓ˆ袁çš”Other-Out of-Distributed皓資æ-™æœüä-†­??�ó�«§œ¨»»·çš”瓧ˆ袁§…§ãuro,è-‰ç“±éEUROURE™­EURO<æƒæ³·aidºŒ­­­�‘ä»cné‡Out-Out of-Distribution皔資æ-™­ˆ†è¨­‡ºäӆ了ãeuro,(<sup/supEURO)

§…»»»æ-æ-‡ç�»«š

瓱æ-á…»»-æ-‡ç�»æœ‰éƒ¨­ˆ†§…§è與æƒæ³³·Ÿ­‰�é�­æ��­ˆ°­ˆ©ç“?Energy Functionçš”?�šæ³??�ä-1\f25Œæ‰EUROUREä»COMENT EURO™é,Š­ƒ…?(能源功能?æ¢�列看é��的相關文ç�»å°±ä¸�å†�進行節錄了。

ğŸ“�:广义ODIN:在不从分布外数据中学习的情况下检测分布外图像,Hsu等人。

ğŸ“�:用于失配检测的特征空间奇异性,黄等。

ğŸ“�:在神经网络中非分布检测的学习置信度,DeVries等人。

ğŸ“�:深度神经网络的可信度感知学习,穆恩等人。

ğŸ“�:具有离群值暴露的深度异常检测,Hendrycks等人。

æœEUROUAL­­Œæƒ³ˆ†äº??EURO?ä»-ä:çš“ç”ç©æœ‰äº†ä?ƒä:>­?æˆ-§…»»-人ReProductionçš“CODEãEURO,Papers With Code

§œ?>Ageé-œ­Ÿºç�çŸ袁識皓資æº�溌é™é†ä²ˆ‘æœEuroæ”>çš“YouTuberè‡è§§é>»æ©Ÿçš”æ��§®�æ’…“æTUBER臭­§é>»æ©Ÿçš”æ��§®�æ‘…èeuro�â?Œæˆ‘è‡?UMichçš“Justin Johnsonæ�ˆé-<çš”计算机视觉深度学习(EECS498âuro“007)çœçœ<é��CS231n的人應該有看é��他出ç�¾åœ¨ä»¥å‰�的課程錄影中,但目å‰�CS231næ�­°…ƒæœEUROUALæ-°çš“錔§25±æ˜“猔皓皔ç®-有é»�ä…?�çœ?Deep Learning for Computer Vision(EECS 498–007) Convolutional Neural Networks for Visual Recognition(CS231n)

上實習時解決的å•�題也越來越實際,剛好在specialization,最近正在看個人覺得還算霉䖊線皓éœEUROWORY±,YOUMAND COLERSERAäœ<ˆ°Andrew Ng§�çš”深度学习。AI有é-<è­ää-EUROæ-EUROæ-°š“面向生产的机器学习工程(MLOPS)EUROWORE-SACOUCOMAND”“深入学习。AI有é--EUROæ-çš”面向生产的机器学习工程(MLOPS)EUROWORE-COURCE-COUCOUTCHš“MLOPS EUROUCTIONS EURO-AUTOWARY”Machine Learning Engineering for Production (MLOps)

œ?æœEUROUAL SARO?Œ

也碰é��一些影åƒ�相關的å•�題,但一直都算是˜åŸŸçš„è�œé›�,ä¸�å¾—ä¸�說能在大學最後一個學期æ�¥è§¸åˆ°é€™å€‹æ¯”賽算是滿幸é�‹çš„,雖然投注很多時間而模å�‹åœ¨æœ€cnn cnn Computer�éŒé>-ç“ç”��cnn Computer™é>-ç“ç”écnn Computer Visioné>-ç“ç”cnn Computer Visionéé-çcnn Computer Visionéé-cnn Computer Visionécnn§Œæ­“è³²æ™,æ²²‘è³³?ç™»�®­�Ÿ§…?�期效能有é»�å�¯æƒœï¼Œä½†æˆ‘覺得在這次比賽é��程中學習到的能力與經驗å��而是最寶貴的,這讓我在看到正å¼�賽表ç�¾ä¸�如é和ˆæ�期皓­?ƒæ…�會é,GBéºç,ΩèGB,ã欧元,

在è�½å®Œé«˜åˆ†éšŠä¼�分享他們的å�šæ³•å¾Œï¼Œæ›´è®“我了解到實務上Simple是最好的Œó…‰æ˜¯å�šå¥½é‚£äº›å¾ˆåŸºç¤�但é��常é‡�è¦�çš„æ“�作後å�¯èƒ½åˆ†æ•¸å°±æœƒä¸�錯了,åƒ�是在å�šã€Œå…¶ä»–é¡�別ã€�的分é¡�å•�題也å�¯èƒ½ç”¨ä¸�到åƒ�我們多列车一個模å�‹å�»è™•ç�†çš„策略;å�¦å¤–,我也å¾�其他隊ä¼�的分享中å†�次體èª�å°�模å�‹ä¾†èªª垃圾入垃圾Outçš“§>Aæ�œé-œä?,aiºŒ§?ˆ?š?œ?…?¥å¤–部資料來盡é‡�擬真貼近訓練資料長相的综合é��程,讓我é��常有收穫,也期許自己之後更注é‡�æµ�程上的細節。雖然ä¸�能ä¿�證未來一定會æœ�CVéEURO EURO SAURE<é˜åŸŸç¹¼çºŒå‰�進,但我èª�為很多機器學翙‘çš“æŠEUROMELè”與çÓ“é©-§…˜»�‘ä»袁ç“”->»‰ç§ˆ°§…(元数据)“->{##**$$}{##**$$}{#**$$}»»-域(­œ¨­‘éçç’æ™,æ

è�‘稳³‡è¨Š

如æ�œå¤§å®¶èƒ½è€�心看到這,希望能å°�ä½和有一ä¸�é»�幫助我都會很高興。若有任何å•�é¡Œã€�錯誤或是單純想互相èª�識一下的話,å�¯ä»¥é€�é��下列資訊è�¯çµ¡æˆ‘。

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/07/26/%e7%8e%89%e5%b1%b1%e4%ba%ba%e5%b7%a5%e6%99%ba%e6%85%a7%e6%8c%91%e6%88%b0%e8%b3%bd2021%e5%b9%b4%e5%a4%8f%e5%ad%a3%e8%b3%bd-%e4%b8%ad%e6%96%87%e5%bd%b1%e5%83%8f%e8%be%a8%e8%ad%98%e7%ab%b6%e8%b3%bd/

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息