磐石
-
spaCy教程学习
spaCy教程学习 作者|PRATEEK JOSHI 编译|VK 来源|Analytics Vidhya 介绍 spaCy是我的自然语言处理(NLP)任务的必备库。我冒昧地说,大多…
-
使用Python和OpenCV在线打乒乓球
作者|Robin White 编译|Flin 来源|towardsdatascience 我最喜欢的YouTuber之一,CodeBullet,曾经尝试创建一个乒乓球 AI来统治所…
-
通过迁移学习建立一个易于使用的图像分割工具
在Jupyter notebook中为图像添加标签,预测新图像并可视化神经网络(并使用Docker Hub共享它们!) 作者|Jenny Huang 编译|Flin 来源|towa…
-
应对机器学习中类不平衡的10种技巧
作者|GUEST BLOG 编译|Flin 来源|analyticsvidhya 总览 熟悉类失衡 了解处理不平衡类的各种技术,例如- 随机欠采样 随机过采样 NearMiss 你…
-
用对比学习训练说话人初步验证模型
作者|OngKoonHan 编译|Flin 来源|towardsdatascience 在我大学的Android开发课程的组项目部分中,我们的团队构建并部署了一个认证系统,通过说话…
-
词袋模型和TF-IDF
作者|PURVA HUILGOL 编译|VK 来源|Analytics Vidhya 机器理解文本的挑战 “语言是一种极好的交流媒介” 你和我很快就会明白那句话。但机器根本无法处理…
-
利用机器学习模型对PySpark流数据进行预测
作者|LAKSHAY ARORA 编译|VK 来源|Analytics Vidhya 概述 流数据是机器学习领域的一个新兴概念 学习如何使用机器学习模型(如logistic回归)使…
-
使用PCA可视化数据
作者|Conor O’Sullivan 编译|VK 来源|Towards Data Science 主成分分析(PCA)是一个很好的工具,可以用来降低特征空间的维数。P…
-
深度学习框架 CatBoost 介绍
作者|Félix Revert 编译|VK 来源|Towards Data Science 介绍 我翻阅了CatBoost的文档之后,我被这个强大的框架震惊了。CatBoost不仅…
-
预训练词嵌入
作者|ARAVIND PAI 编译|VK 来源|Analytics Vidhya 概述 理解预训练词嵌入的重要性 了解两种流行的预训练词嵌入类型:Word2Vec和GloVe 预训…
-
变分自编码器如何淘汰经典的推荐系统
作者|Quentin Bacuet 编译|VK 来源|Medium 随着信息过载的增加,我们不可能通过观看海量的内容来获取我们想要的项目。推荐系统可以来拯救我们。推荐系统是一种模型…
-
机器学习模型的度量选择二
作者|Alvira Swalin 编译|VK 来源|Medium 本系列的第二部分主要讨论分类度量 在第一篇中,我们讨论了回归中使用的一些重要指标、它们的优缺点以及用例。这一部分将…
-
预测酒店预订需求
作者|Dimas Adnan 编译|VK 来源|Towards Data Science 在本文中,我想写一篇关于如何使用Python和Jupyter Notebook构建预测模型…
-
使用Python预测缺失值
作者|Sadrach Pierre, Ph.D. 编译|VK 来源|Towards Data Science 对于数据科学家来说,处理丢失的数据是数据清理和模型开发过程中的一个重要…
-
Mercari数据集——机器学习&深度学习视角
作者|Yogeeshwari S 编译|VK 来源|Towards Data Science 我很高兴与大家分享我的机器学习和深度学习经验,同时我们将在一个Kaggle竞赛得到解决…
-
基于LSTM和词嵌入的tweet文本分类
作者|Emmanuella Anggi 编译|VK 来源|Towards Data Science 在这篇文章中,我将详细介绍如何使用fastText和GloVe作单词嵌入到LST…
-
使用深度学习识别狗的品种
作者|Nouman 编译|VK 来源|Towards Data Science 在这篇文章中,我将教你建立你自己的网页应用程序,它将接受你的狗的图片,并输出其品种。准确率超过80%…
-
PyTorch:Bi-LSTM的文本生成
作者|Fernando López 编译|VK 来源|Towards Data Science “写作没有规定。有时它来得容易而且完美;有时就像在岩石上钻孔,然后用炸药把它炸开一样…
-
2020年文档相似性算法:初学者教程
作者|Masatoshi Nishimura 编译|VK 来源|Towards Data Science 如果你想知道2020年文档相似性任务的最佳算法,你来对了地方。 在3391…
-
利用贝叶斯分类器检测虚假新闻
作者|Victor Sim 编译|VK 来源|Towards Data Science 现在假新闻太多了,很难找到准确无误的消息来源。本文旨在利用朴素贝叶斯分类器对真假新闻进行分类…