科技迷周刊(2024-08-09) : 高质量单张图像生成3D模型
高质量单张图像生成3D模型
稳定快速3D转换技术将一张图片转化为精细的3D模型。它快速且精确,为3D重建设定了新的标杆。
3D重建:制作真实物体的3D副本,捕捉其形状和外观。
Scores科技新闻
Canva可画推出一站式AI创作套件
视觉协作平台Canva可画在中国推出了“魔力工作室”。这一AI套件提供了文字、图像创作、特效和编辑工具,还能设计转场和动画。
“魔力工作室”将多种创意功能整合到一个平台上,简化了设计流程。此举使Canva可画成为AI驱动设计解决方案的领导者。
ReSyncer:高级唇同步技术,统一音视频内容
ReSyncer,一个新框架,解决了视频与音频同步的挑战。它采用重构的Style-based生成器和Transformer技术,无缝融合音频和视觉数据。这项技术无需长时间的训练视频,减少了伪影。它在创建虚拟主持人方面表现出色,支持快速调整,并能模仿说话风格或更换面部。该方法具有多功能性和高质量,适用于多种应用场景。
谷歌增强Chrome浏览器的Gemini驱动功能
谷歌正在推出由 Gemini 驱动的新 Chrome 功能。Lens 之前仅限移动设备使用,现在可在桌面端使用。点击图片,提问,获取答案。Tab Compare 帮助在不同标签页间购物,汇总产品详情。
即将推出历史记录中的自然语言搜索。询问“那家冰淇淋店是什么?”并获得结果。不使用隐身会话中的数据。使用云处理,而非本地处理。
这些更新旨在使浏览更智能、更直观。
Automattic推出AI工具以提升WordPress博客可读性
Automattic,即WordPress.com背后的力量,推出了“Write Brief with AI”,这是一款利用人工智能来提升博客文章质量的工具。它有助于提高文章的清晰度和简洁性,这是人工智能写作辅助工具日益增长的趋势的一部分。
该工具目前处于测试阶段,与Jetpack集成,增强了WordPress.com网站的功能。它提供简化句子的建议,并评估语言的自信度,避免可能使读者困惑的专业术语。
侧边栏提供了一个可读性评分,评估内容的复杂性、句子长度和自信度。这一功能旨在使内容更加易于理解。
Automattic在网络生态系统中的地位,既是开源WordPress项目的贡献者,也是WordPress.com的开发者,赋予了它独特的优势。将人工智能整合到其平台中可能会显著提升其采用率。
该工具源自一个内部黑客周项目,目前仅支持英语。它在简化并改进博客写作方面的潜力是值得期待的。
介绍GMAI-MMBench:一个新的医疗AI评估基准
GMAI-MMBench 是一种用于测试大型视觉语言模型(LVLMs)在医学领域工作效果的新工具。它基于广泛的医疗数据和任务构建,旨在提升人工智能在诊断和治疗中的作用。该基准显示,即使是像 GPT-4o 这样的先进模型,也还有很大的提升空间,准确率仅为 52%。这一工具突显了医疗保健领域对更好人工智能的需求,推动了更有效模型的开发。