solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2024年05月07日 19时03分 星期二
来自华龙之宫
OpenAI 和编程问答平台 Stack Overflow 宣布建立合作关系,OpenAI 将用其平台上丰富的编程相关数据训练 ChatGPT 使用的大模型。但和 Reddit 等平台类似,Stack Overflow 上的内容都是由用户免费创造的,社区成员要求提供双方合作的更详细信息,但未收到有效回复。ChatGPT 训练使用的数据集显然包含了抓取自 Stack Overflow 的问题和答案,现在通过合作 OpenAI 可以直接通过 API 访问 Stack Overflow 的数据。

人工智能
Wilson(42865)
发表于2024年05月07日 18时35分 星期二
来自通往宇宙之门
亚马逊的有声读物平台 Audible 新加入了逾四万种 AI 配音的有声读物。对广大图书作者这是好事,但对人类专业配音者而言这是警钟。对于不想支付高额专业配音费但想要进入利润丰厚的有声读物市场的独立作家来说,亚马逊免费的虚拟旁白工具是游戏规则改变者。一位博主称,使用 AI 配音工具将电子书转换为有声读物只花了 52 分钟。一位叫 George Steffanos 的作者表示更喜欢人类作品而不是 AI 生成作品,但其作品的微薄销量负担不起聘请专业配音者的费用。HarperCollins 等出版商已与 AI 语音公司签署了协议利用 AI 制作有声读物。苹果公司去年也开始销售使用 AI 配音的有声读物,而 AI 使用的声音被认为是基于真实演员的表演,引起了这些演员的抗议。

人工智能
Wilson(42865)
发表于2024年05月07日 14时31分 星期二
来自没有你的天堂
微软内部开发了一个新模型能与 Google、Anthropic 和 OpenAI 的最先进模型相抗衡。该模型内部被称为 MAI-1,由前 Google DeepMind 联合创始人 Mustafa Suleyman 负责,Suleyman 此前担任了 AI 创业公司 Inflection 的 CEO,微软在今年 3 月以 6.5 亿美元收购了其知识产权,雇佣了大部分员工。MAI-1 是微软的全新模型,不是继承自 Inflection,但可能使用了来自 Inflection 的训练数据和其它技术。知情人士称,MAI-1 的参数规模远大于微软此前发布的开源 AI 模型,需要更多的算力和训练数据,成本也更昂贵。MAI-1 将有大约 5000 亿个参数,可进行调整以决定模型在训练期间学习哪些内容。相比下,OpenAI 的 GPT-4 有逾万亿个参数, Meta 和 Mistral 等目前发布的开源模型只有 700 亿个参数。

人工智能
Wilson(42865)
发表于2024年05月04日 23时29分 星期六
来自诺比、龙和意识星云
对科学论文中特定单词使用频率的分析显示,愈来愈多的科学家使用 AI 撰写论文。伦敦大学学院 Andrew Gray 在 3 月发表的一项研究表明,2023 年发表的论文中有 1% 至少部分是由 AI 撰写的。斯坦福大学团队于 4 月发表的第二项研究称,这一数字可能在 6.3%-17.5% 之间,具体取决于论文主题。两项研究都是寻找论文中大模型常用的单词,如 intricate、pivotal 和 meticulously。在 Gray 的研究中,从 2019-2023 年,控制组的单词如 red、conclusion 和 after 的使用频率发生了几个百分点的变化,相比下 meticulous、commendable 和 intricate 等大模型常用词的使用频率分别增加了 59、83 和 117%,而在 2019-2022 年间它们的使用频率几乎没有变化。斯坦福大学的研究发现,realm、showcasing、intricate 和 pivota 单词的使用频率比 2021 年 和 2022 年分别增加了 80%、80%、120% 和近 160%。研究表明,缺乏时间和写作的需求会鼓励使用大模型,大模型有助于增加研究者的论文数量。

人工智能
Wilson(42865)
发表于2024年05月04日 23时08分 星期六
来自勇者物语
美国国务院军控局的首席副助理国务卿 Paul Dean 在一封声明中表示,美国、英国和法国都发表声明,承诺将核武器完全控制在人类而不是 AI 手中,欢迎中国和俄罗斯也发表类似的声明。他说,我们认为这是一种极重要的负责任行为规范,有五大常任理事国的支持会非常受欢迎。美国国务卿 Antony Blinken 上周访问了中国,讨论了核武器和 AI 相关问题。Blinken 称,双方同意未来几周就 AI 问题举行首次双边会谈。

人工智能
Wilson(42865)
发表于2024年04月30日 22时54分 星期二
来自拥王者的女儿
对数百份 LinkedIn 资料和 AI 论文作者的分析发现,搜索巨人是苹果 AI 专家的最大单一来源。苹果至少从 Google 挖走了 36 名 AI 专家,其中包括 2018 年雇佣 John Giannandrea 担任其 AI 团队负责人。Giannandrea 在 Google 工作了八年,领导了其 AI 研究部门。苹果 AI 团队的大部分成员在加州和西雅图工作,在收购了瑞士苏黎世的两家 AI 创业公司——FaceShift 和 Fashwell——之后,苹果在当地建立了一个被称为 Vision Lab 的实验室。苹果还为苏黎世的两处办公室招募雇员。竞争对手微软、Google 和亚马逊都在生成式 AI 上投资了数十亿美元,而苹果一直对其 AI 计划守口如瓶,但随着股价的下跌,该公司也面临越来越大的压力。业内人士称,苹果正专注于在移动设备上部署 AI 模型,让生成式 AI 应用在本地而不是依赖于云端运行。但在手机上运行大模型对硬件性能提出了更高的要求。

人工智能
Wilson(42865)
发表于2024年04月29日 18时40分 星期一
来自平行恋人
清华大学联合生数科技发布了 Sora 的文本视频生成模型 Vidu。该模型采用 Diffusion 与 Transformer 融合的架构 U-ViT,支持一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。Vidu不仅能模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。清华大学教授、生数科技首席科学家朱军表示,与 Sora一致,Vidu 能够根据提供的文本描述直接生成长达 16 秒的高质量视频。除了在时长方面的突破外,Vidu 在视频效果方面实现显著提升,主要体现在模拟真实物理世界、多镜头语言、时空一致性高、理解中国元素等方面。朱军表示,Vidu 的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术 U-ViT 架构由团队于 2022 年 9 月提出,早于 Sora 采用的 DiT 架构,是全球首个 Diffusion 与Transformer 融合的架构,完全由团队自主研发。目前使用 Vidu 需要申请。

人工智能
Wilson(42865)
发表于2024年04月29日 00时10分 星期一
来自智者之惧
微软 Windows 24H2 将包含名为 AI Explorer 的新工具。walkingdog 写道: AI Explorer 的更多功能细节已经流出:AI Explorer 依赖 Windows 设备的 NPU 在后台进行运行,AI Explorer 会理解屏幕上所有应用和画面产生的行为并将它们记录为“记忆”,这些记忆可通过后续的搜索来进行调用,AI Explorer 的大多数计算工作都是在本地进行。AI Explorer 通过记忆提供多种交互方式:AI 搜索和基于上下文的应用操作。通过 AI Explorer 搜索框搜索设备上的记忆,搜索功能完全支持自然语言。比如:找回几天前在网页上看到的有关某些动物的内容,只需要在搜索框中输入“给我展示几天前我在网页上看到的关于某个动物的页面内容”即可。AI Explorer 可以让不同应用之间的内容进行交互协同,比如:在屏幕上打开两份文档,让 AI Explorer 进行对比分析并草拟邮件给出分析结果;在浏览图片时 AI Explorer 会提示一些图片编辑操作(移除背景)等。基于上下文的应用操作不需要开发者专门适配,完全由 AI Explorer 通过理解和学习屏幕内容而给出操作建议。

人工智能
Wilson(42865)
发表于2024年04月28日 20时46分 星期日
来自少数派报告
Pikesville High School 前体育指导员 Dazhon Darien 周四被捕,被控多项罪名,其中之一是伪造了校长 Eric Eiswert 的声音,在社交媒体上发布了种族主义言论,导致了校长被停职。警方称,Darien 制作 AI 语音是为了报复校长,因为校长已对学校资金可能被不正确处理发起调查。他制作的语音模拟校长的声音贬低了黑人学生和犹太社区,该语音在社交媒体上广泛传播。校长被停职,社交媒体传播着一波又一波仇恨信息,学校收到了大量电话。Darien 被捕时正准备飞往休斯顿,他随身携带了武器。

人工智能
Wilson(42865)
发表于2024年04月27日 23时23分 星期六
来自月光狂想曲
Windows 11 的一个预览版本 Insider Build 26200 被发现包含了一个 AI 硬件规格检测工具 AI Explorer。如果你的 PC 硬件未达到标准,它将显示水印形式的警告。目前的 AI Explorer 针对的是 Windows 11 的 ARM64 版本,要求系统配备 NPU 以及 16 GB 内存和 225 GB 系统存储空间。x86 版本目前所知的是 Windows 11 24H2 强制性要求 CPU 必须支持 SSE4.2 指令集,而今天几乎所有 x86 CPU 都支持该指令集。

人工智能
Wilson(42865)
发表于2024年04月26日 23时21分 星期五
来自猛兽的财富
阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B。此前它发布了 0.5B、1.8B、4B、7B、14B 和 72B 不同规模参数的版本。阿里巴巴称,Qwen1.5-110B 模型在基础能力评估中与 Meta-Llama3-70B 相媲美,在 Chat 评估中表现出色,包括 MT-Bench 和 AlpacaEval 2.0。Qwen1.5-110B 与其他 Qwen1.5 模型相似,采用了相同的Transformer 解码器架构。它包含了分组查询注意力(GQA),在模型推理时更加高效。该模型支持 32K tokens 的上下文长度,同时它仍然是多语言的,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。

人工智能
Wilson(42865)
发表于2024年04月25日 23时57分 星期四
来自大魔法师
Adobe 研究人员发表了一篇预印本论文,介绍了一种新的生成式 AI 模型 VideoGigaGAN,它能让将视频分辨率提升到原始分辨率的八倍。研究人员称 VideoGigaGAN 优于其它视频超分辨率(Video Super Resolution 或 VSR)重建方法,能提供更细粒度的细节,不会引入任何 AI 制造的幻影。现有的 VSR 方法如 GAN(Generative Adversarial Networks)能有效提升静态图像的分辨率,但提升视频的分辨率则容易引入闪烁或伪影;其它 VSR 方法能避免这些问题,但清晰度或细节不够。VideoGigaGAN 能综合现有方法的长处,有更高的图像/视频质量,同时能减少闪烁或失真问题。

人工智能
Wilson(42865)
发表于2024年04月25日 17时50分 星期四
来自火星战士
苹果发布了它的开放模型 OpenELM,可以在本地设备而不是云端运行。OpenELM 的权重、训练的不同检查点(checkpoints)、预训练评估微调等的指南都公布在 Hugging Face 平台上。示例代码许可并不禁止商业使用或修改,只是要求在重新发布时包含苹果完整且没有修改过的声明。OpenELM 由一组旨在高效执行文本生成任务的小模型组成,共八个模型,四个预训练四个指令微调,参数规模从 2.7 亿到 30 亿。

人工智能
Wilson(42865)
发表于2024年04月24日 00时01分 星期三
来自月缘
微软发布了其轻量级模型 Phi-3,其中最小版本 Phi-3 Mini 的权重已发布在 Hugging Face 上。Phi-3 有三个版本:Phi-3 Mini 有 38 亿参数,未来计划发布的 Phi-3 Small 有 70 亿参数,Phi-3 Medium 有 140 亿参数。微软高管称 Phi-3 Mini 的性能与 GPT-3.5 接近,但参数规模要小得多。相比参数规模更大的模型,小模型运行开销更低,在个人设备如手机和笔记本上表现更好。

人工智能
Wilson(42865)
发表于2024年04月23日 15时22分 星期二
来自开普罗纳的魔法师
AI 需要消耗大量的电,以至于为满足电力需求科技公司进入了能源行业。OpenAI CEO Sam Altman 最近投资了用太阳能为数据中心供电的公司 Exowatt,OpenAI 的合作伙伴微软正寻求获得核能批准,以帮助运营 AI 服务。去年 AI 公司 Anthropic 的主要投资者亚马逊表示投资了逾 100 个可再生能源项目,使其“连续第四年成为全球最大的可再生能源企业买家”。

人工智能
Wilson(42865)
发表于2024年04月20日 22时56分 星期六
来自人类向何处去
Linus Torvalds 与 Verizon Open Source Program Office 负责人 Dirk Hohndel 谈论了近期火热无比的 AI。Torvalds 讽刺的说,“看起来很搞笑!也许我会被 AI 模型取代!”Hohndel 认为今天的 AI 只是一种更强大的自动修正工具。Torvalds 认为需要再等十年才能知道 AI 会走向何处。Torvalds 已经注意到 AI 狂热对内核的影响——作为 AI 热的最大受益者英伟达公司,其开发者与内核开发者之间的沟通更频繁,该公司正在改进内核的内存管理,因为它需要 Linux 更高效的运行 AI 大模型。Torvalds 对 AI 产生的错误信息表达了谨慎,Hohndel 开玩笑的说这是美丽科学,“美丽科学进,美丽科学出。”

人工智能
Wilson(42865)
发表于2024年04月19日 23时57分 星期五
来自方舟
微软亚洲研究院发布了 VASA-1 模型,该模型能根据一个人的一张照片和一条音轨生成其说话或唱歌的同步动画视频。VASA 代表 Visual Affective Skills Animator,它使用了机器学习分析静态图像和音频片段,然后生成有精确面部表情、头部运动以及与音频口型同步的逼真视频。微软声称该模型在真实性、表现力和效率方面显著优于以前的语音动画方法。微软研究员使用了 VoxCeleb2 数据集训练了 VASA-1。该数据集包含了 6112 位名人的逾 100 万条话语,提取自上传到 YouTube 的视频。VASA-1 能以每秒最高 40 帧的速度生成 512x512 像素分辨率的视频,它潜在可用于深度伪造,研究人员没有公开模型源代码。

人工智能
Wilson(42865)
发表于2024年04月19日 17时04分 星期五
来自来自12个星球的敌人
美国空军试飞院和 DARPA 宣称在机器学习上取得突破,它演示了 AI 软件控制的 F-16 战斗机能与人类飞行员展开近距离缠斗。演示是基于 X-62A VISTA,该试验机是修改版的 F-16 战斗机,集成了飞行模拟器,能让 AI 或者称为机器学习代理(ML-Agents)控制飞机。AI 首次驾驶 X-62A 是在 2022 年 12 月,2023 年 9 月 AI 驾驶的 X-62A 与人类驾驶的 F-16 进行了模拟空战。DARPA 认为,X-62A 团队的成就将被视为类似 AlphaGo Zero 对国际象棋、将棋和围棋的影响,作为军事和商业应用的自主驾驶验证。

人工智能
Wilson(42865)
发表于2024年04月19日 14时06分 星期五
来自火星大师
Meta 发布了 80 亿和 300 亿参数版本的 Llama 3 模型,有 4050 亿参数的版本还在训练之中,将在未来几个月发布,将支持多模和多种语言间的交流,以及更长的上下文窗口。Llama 3 是开放模型,源代码和权重托管在 GitHub 和 Hugging Face 上。Meta 还开放了它的 AI 聊天服务 Meta AI,类似 OpenAI 的 ChatGPT,访问 Meta.ai 也无需注册,但如果要保留聊天记录需要登陆。Meta AI 支持美国、澳大利亚、加拿大、加纳、牙买加、马拉维、新西兰、尼日利亚、巴基斯坦、新加坡、南非、乌干达、赞比亚和津巴布韦等国家和地区的用户访问,可能因为欧盟的法律限制该服务目前不对欧盟用户开放。

人工智能
Wilson(42865)
发表于2024年04月18日 22时20分 星期四
来自彩虹尽头
印度总理莫迪(Narendra Modi)接受该国亚洲国际新闻社(ANI)采访时表示利用 AI 制定了 25 年发展蓝图。他的团队收集了 150 万人的意见,然后用 AI 精炼和分类。莫迪正寻求连任,竞选第三个总理任期,预计会轻松获胜。他没有透露发展路线图的细节,表示会在大选之后实施。他领导的印度人民党周二公布了竞选宣言,承诺利用 AI 打击非法毒品贸易,改善交通管理。其中包括投资 12.4 亿美元支持 AI 发展,构建基础设施,建造至少有 1 万个 GPU 的超算,以及推动构建本土大模型,等等。