bitheerani00000
贫民
贫民
  • UID1926
  • 粉丝0
  • 关注0
  • 发帖数1
阅读:94回复:0

奥巴马任期结束后如何保护美国政府网站和数据

楼主#
更多 发布于:2025-10-19 18:29
早在2016年总统选举周期之前,图书馆员们就已经意识到这个经常被忽视的事实:随着总统任期结束和政府更迭,大量政府数据和数字信息面临着消失的风险。例如,2008年至2012年间,83%的.gov PDF文件消失了。


这就是为什么互联网档案馆与国会图书馆、北德克萨斯大学、乔治华盛顿大学、斯坦福大学、加州数字图书馆和其他公共和私人图书馆的合作伙伴一起努力建立期 手机号数据库列表 末网络档案馆,这是一项广泛的努力,旨在保存联邦政府网站的全部内容,特别是 .gov 和 .mil 域名,以及其他域名上的联邦网站和政府官方社交媒体账户。


虽然学期末网络档案馆并不是互联网档案馆目前为保存政府网站、ftp 站点和数据库而开展的唯一项目,但它却是一个影响深远的项目。


互联网档案馆正在收集来自超过 6,000 个政府域名、超过 200,000 个主机的网页,以及来自约 10,000 个联邦官方社交媒体账户的信息流。这项工作可能将保存数亿个独立的政府网页和数据,最终存档资料的数据总量可能超过 100TB。在其整个网络存档历史中,互联网档案馆已保存了来自 .gov 域名的超过 35 亿个 URL,其中包括超过 4500 万个 PDF 文件。






此次期末收集建立在 2008 年和 2012 年由原始合作伙伴互联网档案馆、美国国会图书馆、北德克萨斯大学和加州数字图书馆发起的类似举措的基础上,旨在记录“政府网站”,该网站没有强制性的、全域的单一保管机构。例如,这是2008 年的国家识字研究所 (NIFL) 网站。该域名于 2011 年下线。同样,可持续发展指标 (SDI)网站 后来也被关闭。其他网站,如invasivespecies.gov 后来被并入更大的机构域名。每个存档的网页都可以通过Wayback Machine访问,过去和现在的期末特定收藏都可以通过主期末门户进行全文搜索。我们还与其他合作伙伴合作,提供对完整数据的访问权限,以用于数据挖掘研究和项目。


该项目今年受到了媒体的广泛关注,《纽约时报》、《政治报》、《华盛顿邮报》、《图书馆杂志》、《主板》等媒体均有相关报道。


“没有任何一个政府机构能够单独负责归档联邦政府的全部网络数据,”互联网档案馆网络归档总监杰斐逊·贝利解释道。“网络数据本身就非常短暂,而没有指定托管机构的网站则更加危险。这些网站包含大量公共资助的联邦研究、数据、项目和报告,它们可能仅存在于网络上或发布于网络上。这些都是极其重要的历史信息。这也为图书馆和档案馆创造了一个绝佳的机会,可以联合各方力量和资源,合作归档这些资料并提供永久访问权限。”


今年,由公民和图书馆员发起的“黑客马拉松”和“提名马拉松”也显著增加。在这些活动中,学科专家和相关信息专业人士将高价值或濒危网站的列表众包给期末存档合作伙伴进行抓取。纽约市的图书馆员团体正在举办 提名活动 ,以确保重要网站得到保护。多伦多大学等大学正在举办 “游击存档”活动,专门致力于保存与气候相关的数据。
游客

返回顶部