Word 迎来最强“搭子”!微软 iOS 版开启 Copilot 协同创作测试
微软邀请iOS用户测试Word中的Copilot协同创作功能,通过自然语言交互提升移动端文档效率。用户可点击图标输入指令,AI将自动生成内容,实现“即刻成文”。
微软邀请iOS用户测试Word中的Copilot协同创作功能,通过自然语言交互提升移动端文档效率。用户可点击图标输入指令,AI将自动生成内容,实现“即刻成文”。
全球首个专业级动画创作AI工具OiiOii于4月2日结束内测并全球上线。该工具采用多智能体协作模式,内置7个专门AI Agent协同工作,旨在通过AI技术降低动画制作门槛,实现“玩具化”的专业创作体验。
腾讯正研发AI产品“探梦 DreamNow”,集创作、社交、互动于一体,支持用户参与互动影游,实现沉浸式体验与全民创作。
谷歌推出iOS离线语音听写应用Google AI Edge Eloquent,基于轻量化模型Gemma实现本地处理,无需网络即可运行,既保护隐私又提升效率。应用能自动润色转录内容,解决语音转文字中常见的废话多、语句不通顺问题。
国家安全部发布AI术语“词元”(Token)安全警示,指出其日均调用量超140万亿,需警惕数据泄露与金融诈骗风险。作为AI信息最小单元,词元兼具可计量、可定价、可交易特征,已成为智能时代“结算单位”。截至2026年3月,我国词元调用量较20
谷歌发布Gemma4系列开源模型,实现AI能力轻量化突破。其中一款仅激活3.8亿参数,性能却超越参数规模20倍的大型模型,使强大AI可轻松部署于手机和轻薄笔记本。该系列包含2.3B和4.5B等不同参数规模的模型,推动人工智能服务更便捷普及。
微软邀请测试iOS版Word新增的Copilot协同创作功能。用户可通过自然语言与AI互动,高效编写编辑文档。在文档中点击Copilot图标,输入想法,AI即生成内容,用户可进一步优化调整。
4月3日,千问APP上线万相2.7视频生成模型,新增视频编辑、续写与动作模仿三大功能。用户可通过简单指令实现猫狗或人物替换、画面修改、风格切换等操作,支持动画、3D、黏土等多种创意风格,光影细节自然匹配。
美团发布原生多模态大模型LongCat-Next,突破传统“语言基座+插件”架构,通过DiNA技术将图像、语音与文本统一转化为同源离散Token,实现AI原生“看”与“听”物理世界,完成多模态建模深度统一。
印度AI初创公司Sarvam AI正进行新一轮融资,目标3亿至3.5亿美元,投后估值或达15亿至15.5亿美元。本轮融资由贝塞默风险投资领投,多家全球科技巨头参与,显示国际资本对印度AI前景的看好。
OpenAI 通过资助“父母与儿童安全 AI 联盟”推动加州立法,倡导年龄验证、家长控制等AI监管原则,但未公开其资助身份,引发儿童安全组织对透明度的担忧。
北京市互联网信息办公室发布公告,对直接调用已备案大模型的生成式人工智能应用实行登记管理,允许其合法上线服务。截至2026年4月3日,北京市新增15款完成登记的服务,为市民提供便利。
Cursor3版本发布,标志着软件开发进入智能体自主工作新阶段。其核心创新是“智能体统一工作区”,支持用户与多个智能体协同工作,实现本地与云端多代码仓库的无缝协作,提升开发效率。
广汽本田P7推送智导互联4.2.2系统OTA升级,核心亮点是全面集成AI大模型,新增“声音复刻”功能。AI大模型提升了座舱交互能力,例如可自动生成旅行攻略,标志着本田在华纯电车型进入大模型驱动新阶段。
红果短剧平台因《桃花簪》涉嫌未经授权使用他人面部形象进行AI处理并丑化角色,于4月3日下架该剧并处罚出品方。出品方未能在审核期内证明素材合规,违反平台规定。此事源于3月底“AI短剧偷脸”话题引发的社会关注。
Ex-Human公司起诉苹果,指控其无证据下架应用并拖欠50万美元收入。旗下应用BotifyAI和PhotifyAI在App Store被下架,但仍在Google商店提供。争议涉及未成年角色色情对话和生成真实人物裸露图像。苹果强调确保应用安
谷歌DeepMind发布新一代开源模型Gemma4,性能实现代际跨越,并将许可证改为Apache2.0,方便开发者商用和二次开发。此次推出四款不同规格模型,覆盖从手机端到工作站的全场景需求。
千问AI眼镜接入蚂蚁GPASS,新增共享单车骑行与停车缴费等“AI办事”功能。用户通过语音唤醒,即可完成多项生活服务。出行时,语音指令配合注视二维码即可开锁;还车时,语音指令自动结算费用。全流程无需手动操作,实现无感化骑行体验。
谷歌更新Gemini API计费结构,新增标准、弹性、优先、批量和缓存版服务档位,满足不同推理需求。弹性档位利用非高峰闲置算力,提供更灵活选择。
通义实验室推出Wan2.7-Video视频创作工具,旨在解决AI视频创作中内容不专业和修改困难两大痛点。该工具支持文本、图像、视频和音频全模态输入,提供先进的模型以提升画面结构、剧情走向等内容的生成质量,增强创作自由度与编辑灵活性。