澳大利亚的大学和新南威尔士州政府是澳大利亚最大的已知数据源之一,用于训练 ChatGPT 等人工智能聊天机器人,但没有收到任何材料补偿。
大部分的海量数据训练强大的生成式 AI 聊天机器人的数据仍然保密,这些聊天机器人有望将白领行业从媒体行业转变为教育行业。但至少有两家主要的人工智能公司——谷歌和 Stability AI——从 Common Crawl 中提取了一些信息,Common Crawl 是一个非营利性项目,扫描互联网,从数十亿页中收集文本。
新南威尔士州政府网页,其中包括来自学校的数千个网站、医院和地方议会为 Common Crawl 贡献的页面比任何其他澳大利亚实体都多,根据其前 500 名注册域名的数据库。紧随其后的是澳大利亚国立大学、阿德莱德大学和墨尔本大学。
就整体而言,这些网站仅对整个 Common Crawl 数据库(以数千 TB 为单位)贡献了一小部分,并且排名远低于维基百科和亚马逊托管页面等主要来源。但它们的存在表明,由数百万人(包括澳大利亚人)创建的、旨在用于完全不同目的的网站如何被输入人工智能系统,这些系统已经为其少数所有者创造了数十亿美元。
社交媒体服务 Reddit 和 Twitter、国际媒体巨头新闻集团和图片库 Getty Images 都要求为人工智能公司使用其数据训练其生成图像和文本系统的方式付费。
与此同时,澳大利亚公共机构只是刚刚接受将他们的数据用于人工智能。澳大利亚国立大学的一位发言人表示,该机构正在密切关注这个问题,但还没有明确的立场。
“这主要是因为如果公司根据美国法律运营,那么他们使用网站内容符合那个国家的立法,而不是澳大利亚的立法,”该发言人说。
“我们的专家指出,由于我们的立法,许多技术创新无法在澳大利亚发生,这是公平交易而不是澳大利亚立法。基于合理使用。”
不同之处在于,在公平交易系统中,受版权保护的材料只能免费用于法律规定的有限目的,其中不包括 AI 培训。其他一切都必须支付。合理使用是美国的法律测试,相反,它是一项可以容纳新技术的广泛原则。
Loading在莫里森政府的领导下,澳大利亚表明它可以制定监管主要技术的全球标准玩家通过介绍新闻媒体 Barga代码。它迫使 Meta(Instagram 和 Facebook 的所有者)和谷歌为其平台上的新闻付费,其他国家此后也纷纷效仿,但 Meta 特别表示将避免进一步付费。
其他国家已经开始使用人工智能。意大利的隐私监管机构在 3 月份阻止了 ChatGPT 在该国的使用,因为它担心“基于用户数据的算法训练处理”的合法性以及聊天机器人分发的不正确信息。在 ChatGPT 做出更改后,它已经恢复。
Dreyfus 的发言人说,联邦司法部长 Mark Dreyfus 的版权圆桌会议在 2 月份的一次会议上讨论了 AI 版权,并同意进一步开展工作。
p>开放数据倡导者担心,这种方法可能会阻碍强大的新工具的开发,而这些工具可能会促进经济发展并消除繁重的工作。
新南威尔士州客户服务部的一位女发言人维护着许多州政府在线服务的负责人表示,该州有一项开放数据政策,要求在适当的情况下免费提供其数据。
加载“它旨在为洞察力、发明和探索提供情报,这些情报可以转化为进入更好的产品和服务,改善日常生活并鼓励业务增长,”该女发言人说。因此,政府数据通常获得合法许可以允许其重复使用。
阿德莱德大学拒绝置评,而谷歌、Common Crawl 和 Stability AI 没有回应置评请求。墨尔本大学发表了一份一般性声明,强调其普遍希望在全球范围内分享其研究成果。
全国高等教育联盟计划召开会议来制定解决该问题的方法。对工作量和剽窃的影响是其总裁艾莉森巴恩斯提出的最大问题。巴恩斯说:“我们希望与会员一起举办论坛,在论坛上我们可以解决这些问题并研究利弊,因为这将对该行业产生重大影响。”
获取新闻和评论每周五在我们的技术通讯中发布技术、小工具和游戏。 在此处注册。
澳洲中文论坛热点
- 悉尼部份城铁将封闭一年,华人区受影响!只能乘巴士(组图)
- 据《逐日电讯报》报导,从明年年中开始,因为从Bankstown和Sydenham的城铁将因Metro South West革新名目而
- 联邦政客们具有多少房产?
- 据本月早些时分报导,绿党副首领、参议员Mehreen Faruqi已获准在Port Macquarie联系其房产并建造三栋投资联