谷歌的“数据集搜索”于 2018 年 9 月首次推出,是 正式 出测试版,索引了近 2500 万个数据集。
数据集搜索可用于从科学研究到更多地了解您最喜欢的爱好的任何事情。
“在网络上,几乎所有你感兴趣的主题都有数百万个数据集。 如果你想买一只小狗,你可以找到收集小狗买家投诉或小狗认知研究的数据集。 或者,如果您喜欢滑雪,您可以找到有关滑雪胜地收入或受伤率和参与人数的数据。”
自测试版发布以来,Google 已根据从用户那里收集的反馈为数据集搜索添加了新功能。 现在,可以根据您需要的数据集类型(表格、图像、文本等)或数据集是否免费提供来过滤结果。
此外,数据集搜索现在可以在移动设备上使用,谷歌表示数据集描述的质量已经“显着提高”。
在数据集搜索中获取内容索引
发布者必须经历的流程才能将其数据集包含在数据集搜索中保持不变。 任何发布数据的人都可以通过使用适当的 schema.org 结构化数据来发现他们的数据集。
请参阅:如何在 Google 数据集搜索中排名
迄今为止,使用数据集搜索的人包括学术研究人员、学生和业务分析师。 最常搜索的数据集包括“教育”、“天气”、“癌症”、“犯罪”、“足球”和“狗”。
数据集中涵盖的最大主题包括地球科学、生物学和农业。 最流行的数据集格式是表格,其中超过 600 万个包含在数据集搜索中。
尽管 Google 已正式退出测试版,但它仍致力于改进数据集搜索,就像它一直在改进其主要搜索引擎一样。