AI日报:讯飞星火Lite API永久*;李开复称大模型疯狂降价是双输;AI特效末日滤镜抖音爆火;AI音乐Suno 融资1.25亿美元
1996年的一天,谭盾在旧金山机场等飞机,听到了老朋友、日本作曲家武满彻去世的消息。武满彻一生都在写自然、梦自然,谭盾有一份冲动,用大自然的声音写一首曲子纪念大师。 不久,纽约爱乐乐团邀谭....
欢迎来到【AI日报】栏目!这里是你每天探索世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:
1、: API永久*开放
科大讯飞宣布API能力正式*开放,降低,推动AI技术。
【AiBase提要:】
🚀 降低开发者调用成本,Pro/Max API费用低至0.21元/万tokens,1token相当于1.5个中文汉字
💡 讯飞星火Lite API永久*开放,开发者仅需2.1元即可调用“讯飞星火3.5Max”生成内容
🌍 科大讯飞全面开放API能力,聚集全球开发者,推动AI技术在各领域应用
2、李开复称大模型疯狂降价是双输 推理大模型成本将每年降10倍
李开复认为中国大模型与美国大模型的差距已经缩小到6个月,展示了中国技术实力的追赶和成就。然而,他对大模型市场的价格战表示忧虑,认为疯狂降价可能导致短期内的双输局面。他强调降价并非商业成功的唯一途径,零一万物将继续推出性能最高的大模型。
【AiBase提要:】
🚀 中国大模型与美国大模型差距缩小到6个月,展示技术实力追赶和成就。
💰 大模型市场价格战引发忧虑,疯狂降价或导致短期内双输局面。
🔮 零一万物计划推出各尺寸模型,致力于做中国最好,强调大尺寸模型在复杂难题中表现优异。
3、百度发布 Comate 代码知识增强2.0
作为基于百度文心大模型打造的代码智能补全和推荐工具,Comate代码知识增强2.0具有全面检索和问答、Web在线检索以及自动生成调用代码和测试用例等三大优势。它为代码编写、学习、面试和测试提供全方位支持,能够加速知识获取,提高编程效率,并生成更贴合业务的代码。
【AiBase提要:】
⚙️ Comate代码知识增强2.0基于百度文心大模型,实时解析开发者编程意图,推荐最佳代码片段和库函数。
🔍 Comate2.0支持全面检索和问答,帮助开发者获取开源框架中具体业务解释,提升编程技能。
💻 Comate2.0能够自动生成调用代码和测试用例,极大提高代码质量和效率。
4、微软发布Phi-3 Vision等最新大模型系列
微软发布了Phi-3系列大型语言模型,展示出强大性能和灵活性,为研究人员和开发者提供了新的工具和可能性。这些模型在特定领域具有独特优势,支持不同上下文长度和拥有不同规模参数。
【AiBase提要:】
🔍 Phi-3Medium14B型号性能强大,竞争力突出,超过了其他大型模型如Command R+104B和GPT3.5。
🔍 Phi-3Small7B型号在资源有限场景下具有潜在应用价值,性能超过了Mistral7B和Llama38B。
🔍 Phi-3系列模型训练使用了4.8T令牌,持续42天,支持长文本数据处理,引入新的分词器和权重兼容性。
详情链接:https://top.aibase.com/tool/phi-3-vision-128k-instruct
5、Windows 11 新增基于AI的复制和粘贴功能
微软在 Windows 11 中引入了新的高级粘贴功能,利用 AI 技术实现剪贴板内容的即时转换。这一功能让用户可以更快地转换剪贴内容为纯文本、Markdown、JSON 等格式,甚至进行摘要、翻译、生成代码等操作,提升工作效率。
【AiBase提要:】
⭐ Windows 11 引入新的高级粘贴功能,利用 AI 技术实现剪贴板内容即时转换。
⭐ PowerToys 的 Advanced Paste 功能允许用户将剪贴内容转换为纯文本、Markdown、JSON 等格式,甚至使用 OpenAI 进行摘要、翻译、生成代码等操作。
⭐ 使用该功能需要添加 OpenAI API 密钥,并购买相应的 OpenAI 积分,以进行转换操作。
6、Adobe Lightroom新增AI魔术橡皮擦功能
Adobe Lightroom最近推出了新增的生成式AI工具,包括对象移除和AI镜头模糊效果,为用户提供了更简单和便捷的照片编辑体验。这些新功能使得背景虚化更自然,删除不需要的物体或人物更轻松。Adobe持续将Firefly AI模型应用于创意软件中,为用户带来更多便利和可能性。
【AiBase提要:】
🎨 “Generative Remove”功能可轻松删除照片中的不需要的物体或人物。
📸 AI镜头模糊工具可一键应用多种模糊效果,提升背景虚化的自然度。
📱 新功能使得使用Lightroom进行照片编辑更加简单和便捷,为新用户提供更友好的操作体验。
7、音乐 AI 初创公司 Suno 完成1.25亿美元融资
Suno 完成1.25亿美元融资,旨在通过其生成式 AI 平台彻底改变音乐行业,引发了人们的激动和版权担忧。随着 AI 在音乐领域的广泛应用,如何平衡技术进步与保护艺术家权益将成为关键问题。
【AiBase提要:】
⭐️ Suno 的 AI 平台有望降低音乐创作门槛,为音乐创作者提供强大工具,挑战传统音乐产业模式。
⭐️ Suno 的创新平台允许任何人通过输入文本提示或歌词来创作原创歌曲,AI 则会根据此生成旋律、和声和完整作曲。
⭐️ Suno 的快速崛起和大额融资发生在关于未经艺术家和权利持有人明确同意使用受版权保护音乐录音来训练 AI 模型的激烈辩论之际。
8、英伟达 GH200超级芯片部署到全球9个超级计算机中
英伟达的GH200超级芯片在全球9台超级计算机中展现出惊人的计算能力,推动高性能计算产业向AI驱动转变。GH200采用了Grace Hopper的异构计算框架,融合了高性能GPU和多功能CPU,具备高性能计算和AI模型处理能力。英伟达在近两年不断布局服务器和高性能计算领域,GH200系列展现出强大的AI和高性能计算能力,加速科学研究进程。
【AiBase提要:】
⭐ 英伟达GH200超级芯片在全球9台超级计算机中实现每秒两百亿亿次浮点数计算的惊人能力
⭐ GH200采用了Grace Hopper的异构计算框架,融合了高性能GPU和多功能CPU,成为AI超算的首选硬件
⭐ GH200系列芯片展现出强大的AI和高性能计算能力,加速科学研究进程
9、ChatGPT改进的数据分析功能开始推送:速度与交互体验大提升
OpenAI推出了最新的ChatGPT数据分析优化功能,提升了处理速度,加入了可交互的图表和表格,使数据分析工具更完备和强大。用户现在更方便进行数据上传、分析和可视化探索,获得更深刻的数据洞察。这种集成了人工智能和高级数据可视化的解决方案,将为数据分析师和业务用户提供巨大帮助。
【AiBase提要:】
🚀 速度提升: GPT-4o的速度优势使数据分析更迅速。
💬 可交互图表和表格: 用户可与数据可视化组件交互,提高工具实用性和灵活性。
📊 直接展示数据: 上传的表格数据直接展示在界面上,用户可直观查看并操作。
10、FIFO-Diffusion:无需额外训练即可生成无限长*
FIFO-Diffusion 项目展示了在无需额外训练的情况下生成无限长*的强大能力,通过对角去噪技术实现了高质量且具有一致性的长*生成。该技术在*生成领域具有明显优势,尽管在复杂画面下可能出现闪烁问题,整体效果令人印象深刻。未来有望解决闪烁问题,提升*生成质量和稳定性。
【AiBase提要:】
✨ 无需额外训练使得FIFO-Diffusion具有明显优势
⚙️ 核心技术为独特的对角去噪方法
🔗 FIFO-Diffusion展示了生成长*的巨大潜力
详情链接:https://top.aibase.com/tool/fifo-diffusion
11、末日滤镜下真人和AI傻傻分不清
这篇文章介绍了抖音博主“速速來電”发布的末日游戏滤镜*,在AI特效生成的图像与真人原图对比下,效果逼真到让人难以分辨。网友热议该*,称赞其逼真效果。博主分享了制作教程,使用美图秀秀App生成末日特效的方法,强调原图质量对效果重要。
【AiBase提要:】
🔍 *展示逼真效果,难以分辨真伪。
📈 *点赞数高达17万,转发2.4万,成为博主历史最佳作品。
💡 制作教程分享技巧,强调原图质量对最终效果至关重要。
详情:https://www.chinaz.com/2024/0522/1618351.shtml
12、B站UP主花式整活:为了教你学英语 AI都开始讲谐音梗了
这篇文章介绍了B站UP主利用AI技术合成明星声音和形象来教授英语,引发了广泛关注。通过谐音梗的方式,*在B站上获得了超过100万的播放量。UP主结合娱乐和教育,创造出独特的学习体验,借助AI技术提升了*制作频率和粉丝数量。然而,使用明星或影视剧素材也存在侵权风险。
【AiBase提要:】
🤖 利用AI技术合成明星声音和形象进行英语教学,吸引大量粉丝关注。
🎬 *通过谐音梗方式,获得超过100万的播放量,增强学习的趣味性和互动性。
💡 UP主结合娱乐和教育,创造出别具一格的学习体验,借助AI技术提升*制作频率和粉丝数量。
详情:https://www.chinaz.com/2024/0522/1618359.shtml
13、谷歌推出的“Say What You See”游戏助力图像阅读和AI提示写作
谷歌推出的“Say What You See”游戏旨在帮助玩家提高图像阅读技能和AI提示写作能力。通过参与游戏,玩家可以锻炼创造力、观察力,体验AI技术在图像生成领域的应用。游戏不仅提供娱乐,还作为学习工具,帮助玩家理解和利用AI技术。总体而言,这款游戏为玩家提供了锻炼图像阅读和AI提示写作能力的平台,是一种寓教于乐的学习方式。
【AiBase提要:】
🎮 游戏旨在帮助玩家提高图像阅读技能和AI提示写作能力。
🧠 参与游戏可锻炼创造力、观察力,体验AI技术在图像生成领域的应用。
📚 游戏不仅提供娱乐,还作为学习工具,帮助玩家理解和利用AI技术。
详情链接:https://artsandculture.google.com/experiment/say-what-you-see/jwG3m7wQShZngw
14、大模型数据标注平台Scale AI融资10亿美元,估值达138亿美元
Scale AI最近获得10亿美元的F轮融资,估值达138亿美元,成为大模型领域独角兽。该公司主要提供数据标注服务,合作伙伴包括OpenAI、微软、Meta等知名公司。另外,Suno也获得1.25亿美元融资,引起关注。
【AiBase提要:】
⭐ Scale AI获得10亿美元F轮融资,估值达138亿美元,成为大模型领域独角兽。
⭐ Scale AI主要提供数据标注服务,合作伙伴包括OpenAI、微软、Meta等知名公司。
⭐ Suno也获得1.25亿美元融资,两笔超过1亿美元的融资事件引发关注。
详情链接:https://top.aibase.com/tool/scale
15、Gabby World V2:融合AI和区块链技术的全新龙与地下城风格游戏问世
Gabby World V2是一款融合了人工智能和区块链技术的创新游戏,提供了独特的角色创建、故事探索和战斗体验。游戏处于Alpha测试阶段,仅对白名单成员开放,参与者有机会赢取奖励。通过融合AI和区块链技术,Gabby World V2打造了创意十足、充满挑战的游戏世界。
【AiBase提要:】
🎮 创新游戏体验,融合AI和区块链技术
🔓 Alpha测试阶段,白名单成员独享,赢取奖励机会
💡 通过独特奖励机制激励玩家积极参与
详情链接:https://medium.com/@Gabby_World/gabby-world-v2-alpha-newbie-guide-72b8ceb97584
16、马斯克的xAI正努力实现Grok多模态化
埃隆・马斯克的人工智能公司xAI正在为其Grok聊天机器人增加多模态输入功能,开发者文档显示了新模型发布进展,Grok1.5V将支持用户上传照片获取文本回复。xAI在缩小与竞争对手差距方面取得进展,尽管相对较新,但在基准测试中表现出潜力。
【AiBase提要:】
⭐ 埃隆・马斯克的xAI公司正为Grok聊天机器人添加多模态输入功能
⭐ 最新的开发者文档显示了xAI在推出新模型方面的进展
⭐ Grok1.5V将允许用户上传照片并获得基于文本的答案