1. 磐创AI-开放猫官方网站首页
  2. 机器学习
  3. TensorFlowNews

热点项目|近期Github热门项目Top5

热点项目|近期Github热门项目Top5

作者 | Walker

编辑 | 安可

出品 | 磐创AI技术团队


【磐创AI导读】:本文为大家总结了二月份最热门的机器学习项目top5。想要获取更多的机器学习、深度学习资源,欢迎大家点击上方蓝字关注我们的公众号:磐创AI


此外,如果你想了解更多优秀的github项目,请关注我们公众号的github系列文章。

推荐 | 7个你最应该知道的机器学习相关github项目

热点 | 六月Github热点项目库总结

热点 | 四月最佳Github项目库与最有趣Reddit热点讨论

 

No1: StyleGAN OfficialTensorFlow Implementation

github地址:https://github.com/NVlabs/stylegan

上面的图片看起来像一幅典型的拼贴画,但事实上,这个收藏里的人都不是真的,这些人都是不存在的。所有这些人都是由称为Stylegan的算法生成的。

自从几年前发明了GAN算法,它的性能一直在稳步提升,但Stylegan的出将比赛提升了好几个level。开发人员提出了两种新的、自动化的方法来量化这些图像的质量,并公开了大量高质量的人脸数据集。


github库同时也包含算法的官方TensorFlow实现。以下是了解有关Stylegan的一些关键资源:

Link

Description

http://stylegan.xyz/paper

Paper PDF.

http://stylegan.xyz/video

Result video.

http://stylegan.xyz/code

Source code.

http://stylegan.xyz/ffhq

Flickr-Faces-HQ dataset.

http://stylegan.xyz/drive

Google Drive folder.

 

No2OpenAI’s Ground-Breaking Language Model GPT-2

github地址:https://github.com/openai/gpt-2


下面来介绍一种来自于OpenAI的突破性语言模型GPT-220192月,GPT-2获得了非官方的“最受欢迎的”自然语言处理图书馆奖。但他们启动GPT-2的方式引起了不少关注,该团队声称该模型工作得很好,但由于害怕恶意使用。他们不能完全开放源代码。然而,他们还是在Github中发布了一个模型的较小版本,访问上述链接即可看到。


GPT-2是一个具有15亿参数的大型语言模型。该模型已经在800万个网页的数据集上进行了训练,当给定文本中的前一个单词时,模型的目标是预测下一个单词。


此外,我们还可以通过一些其它资源了解GPT-2

  • Blog Posthttps://blog.openai.com/better-language-models/

  • Official Paper

https://d4mucfpksywv.cloudfront.net/better-language-models/language-models.pdf

 

No3SC-FEGAN

Github地址:https://github.com/JoYoungjoo/SC-FEGAN


另一个GAN?!没错–Gans正在以狂风暴雨之势席卷数据科学世界。SC-FEGAN在风格上和我们上面讨论的Stylegan算法一样有趣。


上图完美地说明了SC-FEGAN的作用。SC-FEGAN用深度网络编辑面部图像,SC-FEGAN非常适合使用带有草图和颜色的直观输入,进而生成高质量的合成图像。我们使用SN-patchGAN鉴别器和Unet-like 产生器和选通卷积层,当然你可以使用开发人员训练过的深层神经网络编辑各种面部图像。

此外该存储库中还包含了帮助您在自己的计算机上构建SC-FEGAN模型的步骤。还等什么?赶紧来试一下吧!


No4LazyNLP for Creating Massive TextDatasets

github地址:https://github.com/chiphuyen/lazynlp


LazyNLP背后的原理其实很简单——它能够对网站进行爬取、清理和消除重复数据,从而创建大量的单语数据集。Lazynlp将允许您创建比OpenAI用于培训GPT-2模型的数据集更大的数据集。使用这个库,您应该能够创建比OpenAI用于GPT-2的数据集大的数据集。


这个Github存储库还列出了创建自己的自定义NLP数据集需要遵循的5个步骤。如果您对这个项目感兴趣,点击上方链接具体查看详细信息。


No5Subsync

github地址:https://github.com/smacke/subsync


该项目的实施始于2019年的哈克伊利诺斯州,获得了荣誉奖(排名前5名),Subsync是关于“语言无关自动同步字幕到视频,使字幕在视频中对齐到正确的起点”。该算法是利用python中的傅立叶变换技术建立的。

此外,Subsync也可以在VLC媒体播放器中工作!该模型大约需要20-30秒的训练时间(具体训练时间要取决于视频长度)。

 

最后我们给大家介绍一个数据集,Flickr-Faces-HQ Dataset (FFHQ)。(Github地址:https://github.com/NVlabs/ffhq-dataset)。

该数据非常适合学习和使用GAN进行试验,适用于当我们想要搜索高质量图像数据的场景。该数据集由70000张超高质量图像(1024 x 1024)组成,包含的人脸的维度有:如年龄、种族、形象背景等。


磐创粉丝福利加磐小仙好友(微信号:cellerai)并发送关键字“python基础”即可 0元学习七月在线精品课程《Python基础课程升级版》


你也许还想

   CVPR出了篇满分论文!中国小哥用人话为机器人导航,5000多篇论文里夺魁

   从零开始学PyTorch:一文学会线性回归、逻辑回归及图像分类

   LeCun推荐:最新PyTorch图神经网络库,速度快15倍(GitHub+论文)

欢迎扫码关注:

热点项目|近期Github热门项目Top5


觉得赞你就点好看,多谢大佬热点项目|近期Github热门项目Top5

磐创AI:http://www.panchuangai.com/ 智能客服:http://www.panchuangai.com/ TensorFlow:http://panchuang.net 推荐关注公众号:磐创AI

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2019/03/14/7f70e69591/

发表评论

登录后才能评论

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息