跳到主要内容

AI迷周刊(2024-06-10) : 苹果公司2024年全球开发者大会将推出iOS 18和iPadOS 18的人工智能增强功能。

苹果公司2024年全球开发者大会将推出iOS 18和iPadOS 18的人工智能增强功能。

苹果2024年WWDC大会标志着向人工智能的重大转变。新发布的iOS 18和iPadOS 18集成了生成式AI工具,增强了翻译和物体识别等功能。此举旨在与科技巨头谷歌和微软竞争,利用AI简化日常任务。外界猜测苹果可能与OpenAI合作,暗示其在AI领域的竞争优势。

Scores

AI新闻

2024年第一季度:欧洲智能手机市场增长2%,高端机型和AI集成推动销售

2024年第一季度:欧洲智能手机市场回升,增长2%,达到3310万台。三星以37%的份额领先,其次是苹果(22%)和小米(16%)。高端手机(超过800美元)市场份额创下32%的新高。人工智能集成受到消费者青睐。

解释:

  • 人工智能集成: 指在智能手机中融入人工智能功能,通过更智能的功能如预测文本、语音助手和图像识别等,提升用户体验。
Scores

iOS 18 据传将增强安全性和暗黑模式体验

据传,iOS 18将于2024年6月发布,承诺提升安全性和用户体验。主要更新包括:

  • 应用锁定:用户可以使用Face ID或Touch ID为Safari或Mail等单个应用加锁,为隐私保护增添一层保障,超越设备解锁的范畴。
  • 深色模式扩展:苹果计划深化深色模式体验,提供一个更加统一且视觉上舒缓的界面,覆盖原生及第三方应用。

这些功能与更广泛的AI增强功能相辅相成,特别是在Siri上,预计将迎来重大升级。苹果的AI计划名为“苹果智能”,旨在更深入地将机器学习整合到Notes和Safari等应用中,提升功能性和用户互动。

例如,Notes应用将集成音频录制和转录功能,并辅以AI驱动的摘要功能,使其成为捕捉和组织信息的强大工具。同样,Photos应用将引入AI驱动的编辑工具,允许进行更复杂的图像处理。

总体而言,iOS 18体现了苹果对融合安全性、美学和智能的承诺,旨在通过周到且一体化的设计丰富用户体验。

Scores

革命性AI驱动立体显示眼镜

在斯坦福大学,由戈登·韦茨坦领导的一支团队打造了一款眼镜,它们与日常佩戴的普通眼镜无异,却内藏革命性的显示技术。这些看似平凡的眼镜,能将AI生成的3D图像直接投射到标准镜片上。其奥秘在于一种纳米光子超表面波导——一片嵌有微观光学元件的玻璃,能够操控光线。

与目前向双眼展示单一图像的VR和AR头显不同,这款眼镜提供了立体视觉,模拟自然视觉体验。每只眼睛接收到的图像略有差异,增强了真实感。这项技术不仅有望带来沉浸式游戏体验,还可能引导外科医生完成复杂手术,或帮助技师进行精密维修。

尽管原型机尚未在人体上进行测试,但其重量不到苹果Vision Pro的一半。未来的目标包括进一步缩小体积和提高能效。这一创新有望模糊虚拟与现实之间的界限,提供一种感知上真实、难以与真实世界区分的体验。

Scores

广东计划至2027年AI产业规模超3000亿,算力达60EFLOPS

广东计划到2025年,人工智能核心产业规模超过3000亿元,算力达到40EFLOPS。至2027年,算力将超过60EFLOPS,构建全国领先的算法和算力网络。重点发展AI芯片生态和智能感知产业,推动自主可控的大模型产品。

解释:

  • AI核心产业规模: 指人工智能领域内主要产业的经济总量。
  • 算力(EFLOPS): 衡量计算机处理能力的单位,1 EFLOPS等于每秒10^18次浮点运算。
  • AI芯片生态体系: 指围绕AI芯片形成的完整产业链,包括设计、制造、应用等环节。
  • 智能感知产业: 涉及利用传感器等技术实现环境感知和数据收集的产业。
Scores

AI需求推动存储市场超级周期,预计2025年将出现供应短缺

AI需求推动存储市场超级周期,预计2025年将出现供应短缺 AI需求推动存储市场超级周期,预计2025年将出现供应短缺 AI需求推动存储市场超级周期,预计2025年将出现供应短缺

总结: 由于人工智能需求的激增以及过去两年资本投资的不足,内存市场正迎来一个“超级周期”。这种供需失衡预计将在2025年达到顶峰,届时DRAM和HBM(高带宽内存)将面临严重短缺。HBM,一种专为高性能计算设计的特殊类型DRAM,其需求将急剧上升,可能占到DRAM总使用量的30%。

自2022年以来,新制造设施的缺乏和资本支出的减少加剧了供应紧张。内存产品的价格预计将大幅上涨,其中HBM和服务器DRAM引领涨势。在市场战略地位上的SK海力士和三星等公司预计将大幅受益,其市场份额和盈利能力有望增加。

洞察: 这一周期与历史模式不同,主要是因为人工智能应用的特定需求激增和产能扩张的不足投资。转向HBM,每比特需要更多晶圆产能且生产良率较低,进一步复杂化了供应情况。随着客户优先考虑确保供应而非价格,内存市场的动态正在根本性地改变,有利于那些拥有强大生产能力的企业。

解释:

  • DRAM(动态随机存取存储器): 计算机和其他设备中用于临时数据存储的一种内存类型。
  • HBM(高带宽内存): 一种高性能的DRAM,使用堆叠内存芯片,主要用于高端计算系统,如AI服务器。
  • 资本支出(CapEx): 公司用于收购、升级或维护如工厂、机械或设备等有形资产的资金。
  • 晶圆: 半导体材料制成的薄片,用于集成电路的制造。
Scores

文章

微软Edge推出集成Bing的AI生成式工作区

微软Edge推出集成Bing的AI生成式工作区 微软Edge推出集成Bing的AI生成式工作区

微软Edge浏览器现已集成AI功能,根据Bing搜索结果创建专业化的工作区。此功能尚处于实验阶段,允许用户针对特定查询如食谱或DIY项目生成包含相关标签页的工作区。隐私方面,确保不存储任何搜索数据。使用前,需在Edge中启用此功能并重启浏览器。

  • Edge工作区:微软Edge的一项功能,允许用户与他人共享浏览器会话,现通过AI增强,能根据搜索查询自动填充相关网站。
  • AI生成的工作区:一项新功能,Bing中的AI根据特定搜索查询推荐并打开多个相关网站,在专用工作区中展示。
Scores

苹果WWDC 2024:AI整合与软件更新

苹果WWDC 2024:AI整合与软件更新 苹果WWDC 2024:AI整合与软件更新

苹果公司2024年全球开发者大会(WWDC 2024)以“迅速到来”为主题,承诺将重点放在人工智能(AI)在其生态系统中的整合上。备受期待的iOS 18更新,以及其他更新,旨在通过可定制的控制中心和AI驱动的工具(如语音转录和图像编辑)来增强用户交互。值得注意的是,苹果计划整合OpenAI的ChatGPT和可能的谷歌Gemini模型,反映出其在AI合作方面的战略方法。

此次更新还引入了RCS支持,旨在改善跨平台通信。Siri虽然要到2025年才能完全实现AI增强,但将在自然语言处理方面得到改进。从macOS到watchOS,跨设备更新旨在精炼用户体验,强调个性化和性能。

苹果的Vision Pro最近获得中国市场准入,可能会通过生成式AI进行更新,这可能彻底改变AR/VR交互。尽管有硬件传闻,但此次活动将主要聚焦于软件进步,强调苹果通过AI增强其数字生态系统的承诺。

Scores

GPT-4展示了利用零日漏洞的能力

GPT-4展示了利用零日漏洞的能力 GPT-4展示了利用零日漏洞的能力 GPT-4展示了利用零日漏洞的能力 GPT-4展示了利用零日漏洞的能力 GPT-4展示了利用零日漏洞的能力

研究人员利用GPT-4探索未知的“零日”漏洞,成功攻破了超过半数的测试网站。这种方法通过自主运行的机器人程序,其效率比传统的单一代理方法高出550%。尽管存在担忧,GPT-4在聊天机器人模式下缺乏独立利用这些漏洞的理解能力。

解释:

  • 零日漏洞: 指软件开发者尚未知晓的安全缺陷,因此未进行修补,容易被黑客利用。
  • GPT-4: 一种高级人工智能模型,能够生成类似人类的文本并执行复杂的任务。
  • 自主机器人: 无需人类干预即可独立运行的AI驱动程序。
Scores

AI初创公司Cohere筹集了45亿美元资金,标志着人工智能投资热潮的持续。

AI初创公司Cohere筹集了45亿美元资金,标志着人工智能投资热潮的持续。

人工智能初创公司Cohere最近获得了45亿美元的融资,投资方包括英伟达和思科等科技巨头。这一投资热潮紧随ChatGPT引发的AI热潮,凸显出一个趋势:尽管尚未盈利,AI公司仍能吸引大量资本。

Cohere成立于2019年,由前谷歌科学家Aidan Gomez创立,专注于为企业应用定制AI模型,如内容创作和数据分析。其独特之处在于对云服务提供商的中立性,为客户提供灵活性,并避免了像OpenAI这样严重依赖微软的竞争对手所见的独家合作关系。

公司的策略似乎取得了成效,据报道年收入达到3500万美元,较上一年有显著增长。Cohere能够无缝集成到各种云平台中,增强了其吸引力,为企业提供量身定制的AI解决方案,避免了供应商锁定。

尽管前景乐观,AI行业仍面临挑战,包括证明长期可行性以及解决准确性和偏见等担忧。Cohere在竞争激烈的市场中的成功预示着光明的未来,但最终考验在于其能否持续增长并兑现其技术承诺。

Scores

火蚁筏状结构启发韧性材料设计

火蚁筏状结构启发韧性材料设计

宾汉顿大学的新研究探索了火蚁如何形成筏状结构以在洪水中生存。这些蚂蚁通过相互紧抱,创造出一个能在水面上漂浮的浮力结构。由Rob Wagner领导的研究揭示了一种独特的“捕获键”行为,即蚂蚁之间的连接在受到压力时反而增强,这与大多数材料在应力下变弱的情况相反。这种适应性可能启发新型材料的设计,这些材料在机械应力下能自我强化,有望在生物医学植入和软体机器人等领域得到应用。

解释:

  • 捕获键行为: 这是一种现象,指分子间或实体(在此例中为蚂蚁)之间的连接在受到拉力时变得更强。这与大多数材料在应力下通常变弱的情况相反。
  • 生物医学植入和软体机器人: 这些领域需要材料能够承受不同的机械应力。生物医学植入是将设备放置在体内,而软体机器人则涉及使用柔软、有弹性的材料制造机器人。

见解: 火蚁在压力下形成筏状结构的韧性提供了关于适应性和集体生存的深刻教训。Wagner的研究不仅强调了仿生学在工程学中的潜力,还突显了自然系统的复杂性,这些系统往往优于工程材料。这项研究可能为开发更智能、更具韧性的材料铺平道路,这些材料模仿了自然界中发现的自我强化机制。

Scores

清华大学奥特曼算法革新3D建模技术,推动虚拟试穿领域发展

清华大学奥特曼算法革新3D建模技术,推动虚拟试穿领域发展

由清华大学赵浩教授领导的团队开发了Ultraman算法,该算法能够迅速将单一的2D图像转换成精细的3D人体模型。这一创新结合了深度学习与先进的图像处理技术,显著缩短了3D重建所需的时间。Ultraman在捕捉衣物细节和人体动作方面表现出色,对于时尚零售中的虚拟试衣、娱乐行业中的3D角色创作以及个性化健康和健身计划都极具价值。

关键概念解释:

  • 3D重建: 从二维图像或一系列图像中创建物体三维表示的过程。
  • 深度学习: 机器学习的一个分支,使用具有多层(因此称为“深度”)的神经网络来分析包括图像在内的各种数据,用于复杂的任务,如模式识别。
  • 虚拟试衣: 一种技术,允许用户在不实际试穿的情况下看到服装在自己身上的效果,通常使用增强现实或3D建模技术。

洞察:

Ultraman的开发标志着数字真实感的一个重大飞跃,无缝融合了虚拟与现实世界。其应用不仅限于便利性,还承诺彻底改变我们与数字内容的互动方式,从购物到娱乐,乃至医疗保健。实时3D建模的潜力开辟了用户交互和个性化的新领域,预示着一个技术适应我们而非我们适应技术的未来。

Scores

创新的数字孪生技术,用于增强心脏诊断和治疗

创新的数字孪生技术,用于增强心脏诊断和治疗

近期,由肯尼索州立大学的助理教授Lei Shi及其同事领导的数字孪生技术取得了重大进展,彻底改变了心脏力学建模领域。通过将逆向有限元分析(iFEA)框架与实时医学成像相结合,他们显著提高了对心脏组织机械特性的估计精度。

关键创新点:

  1. 动态图像处理: 传统模型依赖静态图像,限制了其对动态数据的适用性。新方法能够熟练处理时间序列图像,这对于捕捉心脏的动态特性至关重要。
  2. 逆问题解决: 与传统模型从已知的物理特性预测心脏行为不同,这项研究利用医学图像来推断这些特性,提供了一种更为个性化的方法。

潜在应用:

  • 个性化诊断与治疗: 实现精确诊断和针对心脏状况的定制治疗计划。
  • 手术模拟: 辅助术前规划,提高手术的准确性和安全性。
  • 药物开发: 加速心脏药物的评估和开发。
  • 健康监测: 通过持续监测促进心脏问题的早期发现。
  • 教育和培训: 提供虚拟手术环境,用于医学培训。
  • 患者特异性管理: 提供定制的治疗策略和预后评估。

未来方向:

  • 集成先进AI技术: 结合深度学习和图神经网络,以改进参数估计和模型效率。
  • 更广泛的医学应用: 将技术扩展到其他领域,如骨骼和脑组织的分析。
  • 智能建模: 开发更智能的模型,以在临床环境中实现快速、准确的预测。
  • 跨学科合作: 通过与工程和计算机科学的伙伴关系,增强医学应用。
  • 临床验证: 确保这些模型在现实世界医疗场景中的实际有效性。

洞察: 这一突破不仅推动了个性化医学的发展,也强调了跨学科研究在医疗保健中的变革潜力。通过连接力学、生物学和计算科学,它为更有效、以患者为中心的护理铺平了道路。

Scores

工具

无缝动作转移:MotionFollower的视频动作复制工具

动作跟随器:一款工具,能将一个视频中的动作转移到另一个视频中,同时保留原视频的背景和外观。它能够复制动作,例如舞蹈,将一个人的动作转移到另一个视频中的不同人物身上。简单、有效、无缝衔接。

Scores

利用AI驱动的RAG系统和大型语言模型提升商业知识检索

AI代理优化了与知识库的交互,简化了企业对大型语言模型(LLMs)的应用。借助AI增强的检索增强生成(RAG)系统,有效促进了知识的检索。LLM代表大型语言模型,这是一种高级AI,能够处理并生成类似人类的文本。

Scores

莫妮卡AI Chrome扩展:超过200万次安装,展示中国科技实力

莫妮卡AI Chrome扩展:超过200万次安装,展示中国科技实力

来自中国的顶尖AI产品“翻译莫妮卡”,作为一款Chrome扩展程序,已实现超过200万次的安装量。这一工具充分展示了国内科技在全球市场上的日益增强的实力。

Scores

诺塔:高级双语会议转录与翻译解决方案

诺塔:高级双语会议转录与翻译解决方案

Notta擅长记录和转录会议。其最新功能可处理双语会议,同时进行转录和翻译,非常适合多语言聚会。

  • 转录: 将口语转换为书面形式。
  • 翻译: 将文本从一种语言转换为另一种语言。
Scores

META AI的“动画绘画”工具:将孩子的涂鸦变成动画

一款名为“绘图变动画”(Animated Drawings)的人工智能工具,能将儿童的素描转化为动画形象。该工具由META AI开发,是一款免费且具有商业潜力的实验性工具,现可于sketch.metademolab.com访问。

Scores

AI驱动的图像工具,用于数字面部和服装交换

AI驱动的图像工具,用于数字面部和服装交换

文章介绍了一款在线人脸和服饰交换的AI工具。该技术允许用户通过数字手段替换图像中的人脸和服装。

解释: AI工具:一种利用人工智能执行任务的软件应用,在此案例中指图像处理。 人脸和服饰交换:通过替换图像中人物的脸部或衣物来改变其外观的过程。

Scores

阿里千问2免费提供3亿token使用权,开启数字经济新机遇

阿里千问2免费提供3亿token使用权,开启数字经济新机遇

“阿里千问2”发布,免费提供3亿token使用权。在此语境中,Token指的是数字交易中的数据单位。此项优惠让用户得以广泛、无偿地使用数据处理能力。这是数字经济领域的一大举措,为用户开启了广阔的机会。 链接:https://mp.weixin.qq.com/s/qG1wbnd7ctBwJ0RtvkzlRQ

Scores

资源

Twitter: AI at Meta

基于Meta Llama构建的FoondaMate,是一款快速成长、始终在线的学习辅助工具,专为学生设计。Llama周边的灵活性和开放生态系统正助力团队为当前300万新兴市场学生用户创造更大影响。了解更多➡️https://go.fb.me/i32auy

社媒言论

  1. 在#VivaTech上揭晓的荣耀AI人像功能,一键提升你的摄影水平!📸✨@荣耀全球 @荣耀法国 —— Viva Technology

  2. 我最近发现了这个基于浏览器的AI/ML库http://github.com/xenova/transformers.js,它是一系列专注于特定任务的AI/ML模型的集合,能够在多种浏览器上运行(利用CPU或GPU,如有可用)。它并非“万能模型”,但相比WebLLM,它的表现要出色得多。 —— Minh-Phuc Tran

  3. 🚨喷火机器狗现已上市!Throwflame推出的首款火焰喷射器机器狗Thermonator已正式发售,定价9420美元。这款四足机器人具备30英尺的火焰喷射范围,可通过智能手机进行操控,并配备了一小时续航电池、激光雷达地图及机载摄像头。其潜在应用领域广泛,包括野火控制、农业管理、娱乐乃至全球统治。来源:Ars Technica。 —— Will

  4. 感谢Ashok!Ashok是第一个加入特斯拉AI/自动驾驶团队的成员,并最终成为领导所有AI/自动驾驶软件的负责人。没有他和我们出色的团队,我们可能只是另一家寻找不存在的自动驾驶供应商的汽车公司。顺便说一句,我从未……Ashok Elluswamy:http://x.com/i/article/1799602451844345856 —— Elon Musk

  5. 马克·古尔曼在《Power On》中指出:苹果在人工智能领域的推进,并非主要针对现有设备,而是为了赋能其下一波硬件浪潮,从增强现实眼镜到配备摄像头的AirPods,再到可能的人形机器人等更多创新产品。来源:https://www.bloomberg.com/news/newsletters/2024-06-09/apple-wwdc-ai-announcements-will-enable-home-robot-ar-glasses-camera-airpods-lx7jem9f —— Ryan Morrison

  6. 该图表展示了RAG(检索增强生成)评估的指标和框架,分为三个主要部分:检索、生成/幻觉和端到端。检索部分的评估指标包括:召回率(Recall)、平均倒数排名(MRR)、平均精度(MAP)。生成/幻觉部分的评估类型有三种:基于n-gram的评估,如BLEU、ROUGE、METEOR等。 —— Y11

  1. Adobe 更新了使用条款,默认将使用云存储内容进行AI训练。这导致一些创作者开始使用Nightshade进行“投毒”。这是一种专门针对未经授权使用AI技术的防御措施。简而言之,Nightshade就像在你的数据中隐藏了“毒药”,如果有人未经允许拿去训练他们的AI模型,该模型就会被误导,效果大打折扣。Eduardo Valdés-Hevia 👁️: 我不使用Adobe的Creative Cloud,因为我更喜欢将文件保存在本地。但看到他们认为可以使用你上传到那里的任何内容进行AI训练,我正在用随机Nightshade“毒化”的图像填满我的整个20GB存储空间。我鼓励其他人也这样做! —— 北火