1. 磐创AI首页
  2. arxiv

2021年09月14日 arxiv 视觉论文速递

An Empirical Study of GPT-3 for Few-Shot Knowledge-Based VQA

K n o w l e d g e – b a s e d v i s u a l q u e s t i o n a n s w e r i n g ( V Q A ) i n v o l v e s a n s w e r i n g q u e s t i o n s
t h a t r e q u i r e e x t e r n a l k n o w l e d g e n o t p r e s e n t i n t h e i m a g e . E x i s t i n g m e t h o d s
f i r s t r e t r i e v e k n o w l e d g e f r o m e x t e r n a l r e s o u r c e s , t h e n r e a s o n o v e r t h e s e l e c t e d
k n o w l e d g e , t h e i n p u t i m a g e , a n d q u e s t i o n f o r a n s w e r p r e d i c t i o n . H o w e v e r , t h i s
t w o – s t e p a p p r o a c h c o u l d l e a d t o m i s m a t c h e s t h a t p o t e n t i a l l y l i m i t t h e V Q A
p e r f o r m a n c e . F o r e x a m p l e , t h e r e t r i e v e d k n o w l e d g e m i g h t b e n o i s y a n d i r r e l e v a n t
t o t h e q u e s t i o n , a n d t h e r e – e m b e d d e d k n o w l e d g e f e a t u r e s d u r i n g r e a s o n i n g m i g h t
d e v i a t e f r o m t h e i r o r i g i n a l m e a n i n g s i n t h e k n o w l e d g e b a s e ( K B ) . T o a d d r e s s
t h i s c h a l l e n g e , w e p r o p o s e P I C a , a s i m p l e y e t e f f e c t i v e m e t h o d t h a t P r o m p t s
G P T 3 v i a t h e u s e o f I m a g e C a p t i o n s , f o r k n o w l e d g e – b a s e d V Q A . I n s p i r e d b y
G P T – 3 ‘ s p o w e r i n k n o w l e d g e r e t r i e v a l a n d q u e s t i o n a n s w e r i n g , i n s t e a d o f u s i n g
s t r u c t u r e d K B s a s i n p r e v i o u s w o r k , w e t r e a t G P T – 3 a s a n i m p l i c i t a n d
u n s t r u c t u r e d K B t h a t c a n j o i n t l y a c q u i r e a n d p r o c e s s r e l e v a n t k n o w l e d g e .
S p e c i f i c a l l y , w e f i r s t c o n v e r t t h e i m a g e i n t o c a p t i o n s ( o r t a g s ) t h a t G P T – 3 c a n
u n d e r s t a n d , t h e n a d a p t G P T – 3 t o s o l v e t h e V Q A t a s k i n a f e w – s h o t m a n n e r b y j u s t
p r o v i d i n g a f e w i n – c o n t e x t V Q A e x a m p l e s . W e f u r t h e r b o o s t p e r f o r m a n c e b y
c a r e f u l l y i n v e s t i g a t i n g : ( i ) w h a t t e x t f o r m a t s b e s t d e s c r i b e t h e i m a g e c o n t e n t ,
a n d ( i i ) h o w i n – c o n t e x t e x a m p l e s c a n b e b e t t e r s e l e c t e d a n d u s e d . P I C a u n l o c k s
t h e f i r s t u s e o f G P T – 3 f o r m u l t i m o d a l t a s k s . B y u s i n g o n l y 1 6 e x a m p l e s , P I C a
s u r p a s s e s t h e s u p e r v i s e d s t a t e o f t h e a r t b y a n a b s o l u t e + 8 . 6 p o i n t s o n t h e
O K – V Q A d a t a s e t . W e a l s o b e n c h m a r k P I C a o n V Q A v 2 , w h e r e P I C a a l s o s h o w s a d e c e n t
f e w – s h o t p e r f o r m a n c e .

LAViTeR: Learning Aligned Visual and Textual Representations Assisted by Image and Caption Generation

P r e – t r a i n i n g v i s u a l a n d t e x t u a l r e p r e s e n t a t i o n s f r o m l a r g e – s c a l e i m a g e – t e x t
p a i r s i s b e c o m i n g a s t a n d a r d a p p r o a c h f o r m a n y d o w n s t r e a m v i s i o n – l a n g u a g e
t a s k s . T h e t r a n s f o r m e r – b a s e d m o d e l s l e a r n i n t e r a n d i n t r a – m o d a l a t t e n t i o n
t h r o u g h a l i s t o f s e l f – s u p e r v i s e d l e a r n i n g t a s k s . T h i s p a p e r p r o p o s e s L A V i T e R ,
a n o v e l a r c h i t e c t u r e f o r v i s u a l a n d t e x t u a l r e p r e s e n t a t i o n l e a r n i n g . T h e m a i n
m o d u l e , V i s u a l T e x t u a l A l i g n m e n t ( V T A ) w i l l b e a s s i s t e d b y t w o a u x i l i a r y t a s k s ,
G A N – b a s e d i m a g e s y n t h e s i s a n d I m a g e C a p t i o n i n g . W e a l s o p r o p o s e a n e w
e v a l u a t i o n m e t r i c m e a s u r i n g t h e s i m i l a r i t y b e t w e e n t h e l e a r n t v i s u a l a n d
t e x t u a l e m b e d d i n g . T h e e x p e r i m e n t a l r e s u l t s o n t w o p u b l i c d a t a s e t s , C U B a n d
M S – C O C O , d e m o n s t r a t e s u p e r i o r v i s u a l a n d t e x t u a l r e p r e s e n t a t i o n a l i g n m e n t i n
t h e j o i n t f e a t u r e e m b e d d i n g s p a c e

Detection of GAN-synthesized street videos

R e s e a r c h o n t h e d e t e c t i o n o f A I – g e n e r a t e d v i d e o s h a s f o c u s e d a l m o s t
e x c l u s i v e l y o n f a c e v i d e o s , u s u a l l y r e f e r r e d t o a s d e e p f a k e s . M a n i p u l a t i o n s
l i k e f a c e s w a p p i n g , f a c e r e e n a c t m e n t a n d e x p r e s s i o n m a n i p u l a t i o n h a v e b e e n t h e
s u b j e c t o f a n i n t e n s e r e s e a r c h w i t h t h e d e v e l o p m e n t o f a n u m b e r o f e f f i c i e n t
t o o l s t o d i s t i n g u i s h a r t i f i c i a l v i d e o s f r o m g e n u i n e o n e s . M u c h l e s s a t t e n t i o n
h a s b e e n p a i d t o t h e d e t e c t i o n o f a r t i f i c i a l n o n – f a c i a l v i d e o s . Y e t , n e w t o o l s
f o r t h e g e n e r a t i o n o f s u c h k i n d o f v i d e o s a r e b e i n g d e v e l o p e d a t a f a s t p a c e
a n d w i l l s o o n r e a c h t h e q u a l i t y l e v e l o f d e e p f a k e v i d e o s . T h e g o a l o f t h i s
p a p e r i s t o i n v e s t i g a t e t h e d e t e c t a b i l i t y o f a n e w k i n d o f A I – g e n e r a t e d v i d e o s
f r a m i n g d r i v i n g s t r e e t s e q u e n c e s ( h e r e r e f e r r e d t o a s D e e p S t r e e t s v i d e o s ) ,
w h i c h , b y t h e i r n a t u r e , c a n n o t b e a n a l y s e d w i t h t h e s a m e t o o l s u s e d f o r f a c i a l
d e e p f a k e s . S p e c i f i c a l l y , w e p r e s e n t a s i m p l e f r a m e – b a s e d d e t e c t o r , a c h i e v i n g
v e r y g o o d p e r f o r m a n c e o n s t a t e – o f – t h e – a r t D e e p S t r e e t s v i d e o s g e n e r a t e d b y t h e
V i d 2 v i d a r c h i t e c t u r e . N o t i c e a b l y , t h e d e t e c t o r r e t a i n s v e r y g o o d p e r f o r m a n c e o n
c o m p r e s s e d v i d e o s , e v e n w h e n t h e c o m p r e s s i o n l e v e l u s e d d u r i n g t r a i n i n g d o e s
n o t m a t c h t h a t u s e d f o r t h e t e s t v i d e o s .

Unsupervised Change Detection in Hyperspectral Images using Feature Fusion Deep Convolutional Autoencoders

B i n a r y c h a n g e d e t e c t i o n i n b i – t e m p o r a l c o – r e g i s t e r e d h y p e r s p e c t r a l i m a g e s i s
a c h a l l e n g i n g t a s k d u e t o a l a r g e n u m b e r o f s p e c t r a l b a n d s p r e s e n t i n t h e d a t a .
R e s e a r c h e r s , t h e r e f o r e , t r y t o h a n d l e i t b y r e d u c i n g d i m e n s i o n s . T h e p r o p o s e d
w o r k a i m s t o b u i l d a n o v e l f e a t u r e e x t r a c t i o n s y s t e m u s i n g a f e a t u r e f u s i o n
d e e p c o n v o l u t i o n a l a u t o e n c o d e r f o r d e t e c t i n g c h a n g e s b e t w e e n a p a i r o f s u c h
b i – t e m p o r a l c o – r e g i s t e r e d h y p e r s p e c t r a l i m a g e s . T h e f e a t u r e f u s i o n c o n s i d e r s
f e a t u r e s a c r o s s s u c c e s s i v e l e v e l s a n d m u l t i p l e r e c e p t i v e f i e l d s a n d t h e r e f o r e
a d d s a c o m p e t i t i v e e d g e o v e r t h e e x i s t i n g f e a t u r e e x t r a c t i o n m e t h o d s . T h e
c h a n g e d e t e c t i o n t e c h n i q u e d e s c r i b e d i s c o m p l e t e l y u n s u p e r v i s e d a n d i s m u c h
m o r e e l e g a n t t h a n o t h e r s u p e r v i s e d o r s e m i – s u p e r v i s e d m e t h o d s w h i c h r e q u i r e
s o m e a m o u n t o f l a b e l i n f o r m a t i o n . D i f f e r e n t m e t h o d s h a v e b e e n a p p l i e d t o t h e
e x t r a c t e d f e a t u r e s t o f i n d t h e c h a n g e s i n t h e t w o i m a g e s a n d i t i s f o u n d t h a t
t h e p r o p o s e d m e t h o d c l e a r l y o u t p e r f o r m e d t h e s t a t e o f t h e a r t m e t h o d s i n
u n s u p e r v i s e d c h a n g e d e t e c t i o n f o r a l l t h e d a t a s e t s .

Panoptic Narrative Grounding

T h i s p a p e r p r o p o s e s P a n o p t i c N a r r a t i v e G r o u n d i n g , a s p a t i a l l y f i n e a n d
g e n e r a l f o r m u l a t i o n o f t h e n a t u r a l l a n g u a g e v i s u a l g r o u n d i n g p r o b l e m . W e
e s t a b l i s h a n e x p e r i m e n t a l f r a m e w o r k f o r t h e s t u d y o f t h i s n e w t a s k , i n c l u d i n g
n e w g r o u n d t r u t h a n d m e t r i c s , a n d w e p r o p o s e a s t r o n g b a s e l i n e m e t h o d t o s e r v e
a s s t e p p i n g s t o n e f o r f u t u r e w o r k . W e e x p l o i t t h e i n t r i n s i c s e m a n t i c r i c h n e s s
i n a n i m a g e b y i n c l u d i n g p a n o p t i c c a t e g o r i e s , a n d w e a p p r o a c h v i s u a l g r o u n d i n g
a t a f i n e – g r a i n e d l e v e l b y u s i n g s e g m e n t a t i o n s . I n t e r m s o f g r o u n d t r u t h , w e
p r o p o s e a n a l g o r i t h m t o a u t o m a t i c a l l y t r a n s f e r L o c a l i z e d N a r r a t i v e s a n n o t a t i o n s
t o s p e c i f i c r e g i o n s i n t h e p a n o p t i c s e g m e n t a t i o n s o f t h e M S C O C O d a t a s e t . T o
g u a r a n t e e t h e q u a l i t y o f o u r a n n o t a t i o n s , w e t a k e a d v a n t a g e o f t h e s e m a n t i c
s t r u c t u r e c o n t a i n e d i n W o r d N e t t o e x c l u s i v e l y i n c o r p o r a t e n o u n p h r a s e s t h a t a r e
g r o u n d e d t o a m e a n i n g f u l l y r e l a t e d p a n o p t i c s e g m e n t a t i o n r e g i o n . T h e p r o p o s e d
b a s e l i n e a c h i e v e s a p e r f o r m a n c e o f 5 5 . 4 a b s o l u t e A v e r a g e R e c a l l p o i n t s . T h i s
r e s u l t i s a s u i t a b l e f o u n d a t i o n t o p u s h t h e e n v e l o p e f u r t h e r i n t h e d e v e l o p m e n t
o f m e t h o d s f o r P a n o p t i c N a r r a t i v e G r o u n d i n g .

LibFewShot: A Comprehensive Library for Few-shot Learning

F e w – s h o t l e a r n i n g , e s p e c i a l l y f e w – s h o t i m a g e c l a s s i f i c a t i o n , h a s r e c e i v e d
i n c r e a s i n g a t t e n t i o n a n d w i t n e s s e d s i g n i f i c a n t a d v a n c e s i n r e c e n t y e a r s . S o m e
r e c e n t s t u d i e s i m p l i c i t l y s h o w t h a t m a n y g e n e r i c t e c h n i q u e s o r ` ` t r i c k s ‘ ‘ , s u c h
a s d a t a a u g m e n t a t i o n , p r e – t r a i n i n g , k n o w l e d g e d i s t i l l a t i o n , a n d
s e l f – s u p e r v i s i o n , m a y g r e a t l y b o o s t t h e p e r f o r m a n c e o f a f e w – s h o t l e a r n i n g
m e t h o d . M o r e o v e r , d i f f e r e n t w o r k s m a y e m p l o y d i f f e r e n t s o f t w a r e p l a t f o r m s ,
d i f f e r e n t t r a i n i n g s c h e d u l e s , d i f f e r e n t b a c k b o n e a r c h i t e c t u r e s a n d e v e n
d i f f e r e n t i n p u t i m a g e s i z e s , m a k i n g f a i r c o m p a r i s o n s d i f f i c u l t a n d
p r a c t i t i o n e r s s t r u g g l e w i t h r e p r o d u c i b i l i t y . T o a d d r e s s t h e s e s i t u a t i o n s , w e
p r o p o s e a c o m p r e h e n s i v e l i b r a r y f o r f e w – s h o t l e a r n i n g ( L i b F e w S h o t ) b y
r e – i m p l e m e n t i n g s e v e n t e e n s t a t e – o f – t h e – a r t f e w – s h o t l e a r n i n g m e t h o d s i n a
u n i f i e d f r a m e w o r k w i t h t h e s a m e s i n g l e c o d e b a s e i n P y T o r c h . F u r t h e r m o r e , b a s e d
o n L i b F e w S h o t , w e p r o v i d e c o m p r e h e n s i v e e v a l u a t i o n s o n m u l t i p l e b e n c h m a r k
d a t a s e t s w i t h m u l t i p l e b a c k b o n e a r c h i t e c t u r e s t o e v a l u a t e c o m m o n p i t f a l l s a n d
e f f e c t s o f d i f f e r e n t t r a i n i n g t r i c k s . I n a d d i t i o n , g i v e n t h e r e c e n t d o u b t s o n
t h e n e c e s s i t y o f m e t a – o r e p i s o d i c – t r a i n i n g m e c h a n i s m , o u r e v a l u a t i o n r e s u l t s
s h o w t h a t s u c h k i n d o f m e c h a n i s m i s s t i l l n e c e s s a r y e s p e c i a l l y w h e n c o m b i n e d
w i t h p r e – t r a i n i n g . W e h o p e o u r w o r k c a n n o t o n l y l o w e r t h e b a r r i e r s f o r
b e g i n n e r s t o w o r k o n f e w – s h o t l e a r n i n g b u t a l s o r e m o v e t h e e f f e c t s o f t h e
n o n t r i v i a l t r i c k s t o f a c i l i t a t e i n t r i n s i c r e s e a r c h o n f e w – s h o t l e a r n i n g . T h e
s o u r c e c o d e i s a v a i l a b l e f r o m

Negative Sample Matters: A Renaissance of Metric Learning for Temporal Grounding

T e m p o r a l g r o u n d i n g a i m s t o t e m p o r a l l y l o c a l i z e a v i d e o m o m e n t i n t h e v i d e o
w h o s e s e m a n t i c s a r e r e l a t e d t o a g i v e n n a t u r a l l a n g u a g e q u e r y . E x i s t i n g m e t h o d s
t y p i c a l l y a p p l y a d e t e c t i o n o r r e g r e s s i o n p i p e l i n e o n t h e f u s e d r e p r e s e n t a t i o n
w i t h a f o c u s o n d e s i g n i n g c o m p l i c a t e d h e a d s a n d f u s i o n s t r a t e g i e s . I n s t e a d ,
f r o m a p e r s p e c t i v e o n t e m p o r a l g r o u n d i n g a s a m e t r i c – l e a r n i n g p r o b l e m , w e
p r e s e n t a D u a l M a t c h i n g N e t w o r k ( D M N ) , t o d i r e c t l y m o d e l t h e r e l a t i o n s b e t w e e n
l a n g u a g e q u e r i e s a n d v i d e o m o m e n t s i n a j o i n t e m b e d d i n g s p a c e . T h i s n e w
m e t r i c – l e a r n i n g f r a m e w o r k e n a b l e s f u l l y e x p l o i t i n g n e g a t i v e s a m p l e s f r o m t w o
n e w a s p e c t s : c o n s t r u c t i n g n e g a t i v e c r o s s – m o d a l p a i r s f r o m a d u a l m a t c h i n g
s c h e m e a n d m i n i n g n e g a t i v e p a i r s a c r o s s d i f f e r e n t v i d e o s . T h e s e n e w n e g a t i v e
s a m p l e s c o u l d e n h a n c e t h e j o i n t r e p r e s e n t a t i o n l e a r n i n g o f t w o m o d a l i t i e s v i a
c r o s s – m o d a l p a i r d i s c r i m i n a t i o n t o m a x i m i z e t h e i r m u t u a l i n f o r m a t i o n .
E x p e r i m e n t s s h o w t h a t D M N a c h i e v e s h i g h l y c o m p e t i t i v e p e r f o r m a n c e c o m p a r e d w i t h
s t a t e – o f – t h e – a r t m e t h o d s o n f o u r v i d e o g r o u n d i n g b e n c h m a r k s . B a s e d o n D M N , w e
p r e s e n t a w i n n e r s o l u t i o n f o r S T V G c h a l l e n g e o f t h e 3 r d P I C w o r k s h o p . T h i s
s u g g e s t s t h a t m e t r i c – l e a r n i n g i s s t i l l a p r o m i s i n g m e t h o d f o r t e m p o r a l
g r o u n d i n g v i a c a p t u r i n g t h e e s s e n t i a l c r o s s – m o d a l c o r r e l a t i o n i n a j o i n t
e m b e d d i n g s p a c e .

Spatio-Temporal Recurrent Networks for Event-Based Optical Flow Estimation

E v e n t c a m e r a h a s o f f e r e d p r o m i s i n g a l t e r n a t i v e f o r v i s u a l p e r c e p t i o n ,
e s p e c i a l l y i n h i g h s p e e d a n d h i g h d y n a m i c r a n g e s c e n e s . R e c e n t l y , m a n y d e e p
l e a r n i n g m e t h o d s h a v e s h o w n g r e a t s u c c e s s i n p r o v i d i n g m o d e l – f r e e s o l u t i o n s t o
m a n y e v e n t – b a s e d p r o b l e m s , s u c h a s o p t i c a l f l o w e s t i m a t i o n . H o w e v e r , e x i s t i n g
d e e p l e a r n i n g m e t h o d s d i d n o t a d d r e s s t h e i m p o r t a n c e o f t e m p o r a l i n f o r m a t i o n
w e l l f r o m t h e p e r s p e c t i v e o f a r c h i t e c t u r e d e s i g n a n d c a n n o t e f f e c t i v e l y e x t r a c t
s p a t i o – t e m p o r a l f e a t u r e s . A n o t h e r l i n e o f r e s e a r c h t h a t u t i l i z e s S p i k i n g N e u r a l
N e t w o r k s u f f e r s f r o m t r a i n i n g i s s u e s f o r d e e p e r a r c h i t e c t u r e . T o a d d r e s s t h e s e
p o i n t s , a n o v e l i n p u t r e p r e s e n t a t i o n i s p r o p o s e d t h a t c a p t u r e s t h e e v e n t s
t e m p o r a l d i s t r i b u t i o n f o r s i g n a l e n h a n c e m e n t . M o r e o v e r , w e i n t r o d u c e a
s p a t i o – t e m p o r a l r e c u r r e n t e n c o d i n g – d e c o d i n g n e u r a l n e t w o r k a r c h i t e c t u r e f o r
e v e n t – b a s e d o p t i c a l f l o w e s t i m a t i o n , w h i c h u t i l i z e s C o n v o l u t i o n a l G a t e d
R e c u r r e n t U n i t s t o e x t r a c t f e a t u r e m a p s f r o m a s e r i e s o f e v e n t i m a g e s . B e s i d e s ,
o u r a r c h i t e c t u r e a l l o w s s o m e t r a d i t i o n a l f r a m e – b a s e d c o r e m o d u l e s , s u c h a s
c o r r e l a t i o n l a y e r a n d i t e r a t i v e r e s i d u a l r e f i n e s c h e m e , t o b e i n c o r p o r a t e d . T h e
n e t w o r k i s e n d – t o – e n d t r a i n e d w i t h s e l f – s u p e r v i s e d l e a r n i n g o n t h e
M u l t i – V e h i c l e S t e r e o E v e n t C a m e r a d a t a s e t . W e h a v e s h o w n t h a t i t o u t p e r f o r m s
a l l t h e e x i s t i n g s t a t e – o f – t h e – a r t m e t h o d s b y a l a r g e m a r g i n .

Temporally Coherent Person Matting Trained on Fake-Motion Dataset

W e p r o p o s e a n o v e l n e u r a l – n e t w o r k – b a s e d m e t h o d t o p e r f o r m m a t t i n g o f v i d e o s
d e p i c t i n g p e o p l e t h a t d o e s n o t r e q u i r e a d d i t i o n a l u s e r i n p u t s u c h a s t r i m a p s .
O u r a r c h i t e c t u r e a c h i e v e s t e m p o r a l s t a b i l i t y o f t h e r e s u l t i n g a l p h a m a t t e s b y
u s i n g m o t i o n – e s t i m a t i o n – b a s e d s m o o t h i n g o f i m a g e – s e g m e n t a t i o n a l g o r i t h m
o u t p u t s , c o m b i n e d w i t h c o n v o l u t i o n a l – L S T M m o d u l e s o n U – N e t s k i p c o n n e c t i o n s .

TADA: Taxonomy Adaptive Domain Adaptation

T r a d i t i o n a l d o m a i n a d a p t a t i o n a d d r e s s e s t h e t a s k o f a d a p t i n g a m o d e l t o a
n o v e l t a r g e t d o m a i n u n d e r l i m i t e d o r n o a d d i t i o n a l s u p e r v i s i o n . W h i l e t a c k l i n g
t h e i n p u t d o m a i n g a p , t h e s t a n d a r d d o m a i n a d a p t a t i o n s e t t i n g s a s s u m e n o d o m a i n
c h a n g e i n t h e o u t p u t s p a c e . I n s e m a n t i c p r e d i c t i o n t a s k s , d i f f e r e n t d a t a s e t s
a r e o f t e n l a b e l e d a c c o r d i n g t o d i f f e r e n t s e m a n t i c t a x o n o m i e s . I n m a n y
r e a l – w o r l d s e t t i n g s , t h e t a r g e t d o m a i n t a s k r e q u i r e s a d i f f e r e n t t a x o n o m y t h a n
t h e o n e i m p o s e d b y t h e s o u r c e d o m a i n . W e t h e r e f o r e i n t r o d u c e t h e m o r e g e n e r a l
t a x o n o m y a d a p t i v e d o m a i n a d a p t a t i o n ( T A D A ) p r o b l e m , a l l o w i n g f o r i n c o n s i s t e n t
t a x o n o m i e s b e t w e e n t h e t w o d o m a i n s . W e f u r t h e r p r o p o s e a n a p p r o a c h t h a t j o i n t l y
a d d r e s s e s t h e i m a g e – l e v e l a n d l a b e l – l e v e l d o m a i n a d a p t a t i o n . O n t h e
l a b e l – l e v e l , w e e m p l o y a b i l a t e r a l m i x e d s a m p l i n g s t r a t e g y t o a u g m e n t t h e
t a r g e t d o m a i n , a n d a r e l a b e l l i n g m e t h o d t o u n i f y a n d a l i g n t h e l a b e l s p a c e s . W e
a d d r e s s t h e i m a g e – l e v e l d o m a i n g a p b y p r o p o s i n g a n u n c e r t a i n t y – r e c t i f i e d
c o n t r a s t i v e l e a r n i n g m e t h o d , l e a d i n g t o m o r e d o m a i n – i n v a r i a n t a n d c l a s s
d i s c r i m i n a t i v e f e a t u r e s . W e e x t e n s i v e l y e v a l u a t e t h e e f f e c t i v e n e s s o f o u r
f r a m e w o r k u n d e r d i f f e r e n t T A D A s e t t i n g s : o p e n t a x o n o m y , c o a r s e – t o – f i n e
t a x o n o m y , a n d p a r t i a l l y – o v e r l a p p i n g t a x o n o m y . O u r f r a m e w o r k o u t p e r f o r m s
p r e v i o u s s t a t e – o f – t h e – a r t b y a l a r g e m a r g i n , w h i l e c a p a b l e o f a d a p t i n g t o n e w
t a r g e t d o m a i n t a x o n o m i e s .

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/09/14/2021%e5%b9%b409%e6%9c%8814%e6%97%a5-arxiv-%e8%a7%86%e8%a7%89%e8%ae%ba%e6%96%87%e9%80%9f%e9%80%92/

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息