如果您正在寻找可与 AWS 服务一起使用
用于训练的数据越多越好,但仅有数据是不够的。确保数据集与手头的任务相关且质量高也同样重要。对于那些深入研究金融领域机器学习的复杂世界的人来说,确保数据的相关性和质量至关重要。探索机器学习在金融领域的应用可以为如何为金融模型有效选择和利用数据集提供宝贵的见解。
为了省去您筛选所有选项的麻烦,我们编制了一份机器学习前 20 个免费数据集的列表。
开放数据集
开放数据集平台上的数据集可与许多流行的机器学习框架一起使用。这些数据集组织良好且定期更新,对于任何寻找高质量数据的人来说都是宝贵的资源。
1. Kaggle 数据集
如果您正在寻找高质量的数据集来训练模型,那么 Kaggle 就是您的不二之选。这里有超过 1TB 的可用数据,并且由一个积极参与的社区不断更新,该社区贡献新代码或输入文件来帮助塑造平台,您很难找不到所需的东西!
Kaggle 数据集
#2 UCI 机器学习库
UCI 机器学习存储库是一个著名的数据集来源,其中包含机器学习社区中流行的各种数据集。该项目生成的数据集质量很高,可用于各种任务。用户贡献的性质意味着并非每个数据集都是 100% 干净的,但大多数数据集都经过精心策划,以满足特定需求,而不会出现重大问题。
UCI 机器学习库
3. AWS 公共数据集
如果您正在寻找可与 AWS 服务一起使用的大型数据集,那么 AWS 公共数据集存储库就是您的最佳选择。在这里,数据集围绕特定用例进行组织,并预装了与 AWS 平台集成的工具。AWS Open Data Registry 的一个主要优势是 日本消费者手机号码列表 其用户反馈功能,该功能允许用户添加和修改数据集。
AWS 公共数据集
4. Google 数据集搜索
Google 的数据集搜索是一个相对较新的工具,它可以轻松找到数据集,无论其来源如何。数据集根据各种元数据进行索引,让您轻松找到所需内容。虽然选择不如此列表中的其他选项那么丰富,但它每天都在增长。
Google 数据集搜索
两个人在笔记本电脑上进行机器学习项目
为您的机器学习项目寻找开源数据集。
公共政府数据集/政府数据门户
大数据分析的威力也在政府层面得到体现。通过获取人口统计数据,政府可以做出更符合公民需求的决策,而基于这些模型的预测可以帮助决策者在问题出现之前制定更好的政策。
頁:
[1]