跳到主要内容

AI迷周刊(2024-06-17) : 马来西亚宣布新建人工智能驱动的港口以提升物流效率

马来西亚宣布新建人工智能驱动的港口以提升物流效率

马来西亚宣布新建人工智能驱动的港口以提升物流效率

马来西亚计划在波德申建设一座新的人工智能驱动港口,旨在利用全球供应链转移的趋势。该港口预计耗资4.25亿美元,是Tanco控股公司与中国的CCCC疏浚公司合作的成果,将成为马来西亚首个集成AI以提高运营效率的港口。

该港口战略性地位于吉隆坡附近及马六甲海峡这一关键海上通道,将采用包括AI管理的物流和自动化起重机在内的先进自动化技术。这一举措预计将促进当地经济和贸易,反映了马来西亚向现代化物流基础设施战略转变的意图。

AI的集成有望提高效率,减少人为错误和环境影响,与全球港口自动化和数字化的趋势相符。此举彰显了马来西亚在不断变化的物流领域中确立自身关键角色的雄心。

Scores

AI新闻

YouTube 测试 AI 直播聊天总结和频道二维码

YouTube正在尝试利用AI生成直播聊天摘要和频道二维码。AI摘要能够压缩直播期间的聊天对话,帮助观众快速把握聊天的核心内容。这些摘要会动态更新,反映最新的聊天活动,但不包括被管理的内容。

频道二维码简化了创作者频道的分享过程。无论是创作者还是观众,都可以生成这些二维码,扫描后即可直接跳转到相应的YouTube频道。这一功能目前正在测试中,旨在简化频道的推广流程。

尽管这些创新看似微小,但它们体现了YouTube致力于提升用户和创作者体验的承诺。AI摘要有可能通过使聊天互动更加易于访问来增加观众的参与度。同时,二维码提供了一个实用的工具,用于提升频道的可见性和增长。

Scores

美图公司推出AI游戏广告平台“奇觅”,革新广告制作与投放

美图公司推出“奇觅”平台,利用AI技术革新游戏广告的制作与投放流程。该平台整合了美图在AI影像处理和游戏营销方面的专业知识,旨在覆盖主流广告渠道,简化广告制作流程,大幅提升工作效率。

同时,美图通过收购睿晟天和并发布视觉大模型4.0,不断加强其在设计和视频领域中AI技术的应用。新推出的数字人生成工具DreamAvatar,进一步扩展了其在影视行业的服务能力。

这些举措表明,AI技术将成为未来影像制作的主导力量,其生成技术有望超越传统拍摄方法,成为行业新常态。

Scores

苹果与OpenAI合作,将设备中心的人工智能整合。

苹果与OpenAI合作,将设备中心的人工智能整合。

苹果与OpenAI合作,其AI策略独树一帜。与依赖云服务的竞争对手不同,苹果的AI技术——名为“苹果智能”,坚持设备为本,强调用户赋能而非替代。其采用的30亿参数模型与OpenAI的1750亿参数GPT-3形成对比,旨在实现高效能而不增加电池负担。今年晚些时候,ChatGPT将整合进苹果设备,以提升Siri功能。隐私保护始终是首要任务,数据本地化处理,避免云端安全风险。这种审慎的AI整合策略,注重个人数据的有效利用,标志着战略上的转变,可能重塑AI在消费科技中的角色。

Scores

Sakana AI以独特的AI方法追求独角兽地位

Sakana AI以独特的AI方法追求独角兽地位

由前谷歌研究人员共同创立的Sakana AI,在完成1.25亿美元的融资轮后,正瞄准11亿美元的估值。这一飞跃将标志着日本最快达到独角兽地位的壮举。该初创公司于2023年成立,打破了巨型AI系统的趋势,转而采用受生物进化启发的策略,通过合并小型模型来构建高效且复杂的AI。这种成本和能耗较低的策略,在全球蓬勃发展的生成式AI市场中吸引了众多国际投资者。

生成式AI,以OpenAI的ChatGPT为代表,经历了飞速增长,吸引了大量风险资本。OpenAI自身的估值已达800亿美元。Sakana的独特方法使其在谷歌和OpenAI等巨头主导的领域中成为竞争者,凸显了向更可持续AI开发实践的转变。

Scores

苹果在iOS 18和MacOS Sequoia中整合了AI与ChatGPT

苹果公司推出智能技术,将人工智能融入iOS 18、iPadOS 18和MacOS Sequoia系统,核心采用OpenAI的ChatGPT技术。此举标志着苹果对三星、谷歌和微软等竞争对手已采用生成式AI的策略性回应。

苹果的策略侧重于个人化情境,提升Siri理解自然语言、回应后续问题以及屏幕内容的能力。Siri的更新包括屏幕感知和在应用内执行任务的能力,利用个人情境提供更高效的辅助。

生产力工具得到加强,提供电子邮件优先级排序、消息摘要和跨应用写作辅助等功能。苹果强调隐私保护,多数AI模型在设备上运行,对于需要更多计算力的任务则使用私有云计算。

苹果通过人工智能的整合,旨在通过个性化技术实现差异化,确保技术不仅智能,而且与每位用户的情境相关。

Scores

特斯拉股东将决定埃隆·马斯克的薪酬方案

特斯拉股东面临一项关键投票,即关于埃隆·马斯克价值449亿美元的薪酬方案,这一决定可能影响他对公司的承诺。若方案遭否决,马斯克可能会将人工智能研究转向其他业务或完全退出。尽管方案获得批准的可能性较大,但并不能完全确保马斯克在特斯拉的未来,因为他曾暗示寻求更大的股份。

该薪酬方案最初被特拉华州法官判定无效,遭到部分投资者的反对,他们担忧方案的规模及特斯拉近期的业绩表现。然而,持有大多数股份的个人股东预计将支持该方案。特斯拉领导层,包括董事长罗宾·德霍姆,认为该方案推动了巨大的价值创造,敦促股东予以批准。

此次投票不仅关乎薪酬,更是对马斯克领导力和特斯拉在人工智能及电动汽车领域战略方向的公投。结果将对特斯拉的发展轨迹及马斯克塑造其未来的角色产生重大影响。

Scores

文章

CS-Bench: 计算机科学中评估人工智能的综合基准

CS-Bench,一项新的双语基准测试,评估大型语言模型(LLMs)在计算机科学领域的性能。该基准涵盖了26个子领域,测试了超过30种模型。结果显示,计算机科学、数学和编程能力之间存在显著的正相关关系。CS-Bench揭示了LLMs需要改进的领域,并可能重新定义我们评估人工智能在计算机科学中推理能力的方式。

Scores

雅虎新闻应用复兴Artifact,为用户提供个性化AI驱动的新闻体验

雅虎新闻应用复兴Artifact,为用户提供个性化AI驱动的新闻体验

由Instagram创始人打造的Artifact新闻应用现已赋能雅虎新闻,支持iOS及Android平台。该应用根据用户兴趣定制新闻内容,提供长篇文章的摘要,并按用户偏好过滤信息。雅虎于四月收购Artifact,并整合其AI技术以优化新闻分发。新应用保留了部分社交分享功能,并引入了类似游戏的阅读徽章系统。

Scores

构建融合社会情绪的全面ESG评分系统

本文探讨了开发一套系统的ESG(环境、社会和治理)评分体系,并通过融入社会情感因素加以强化。该项目采用了随机森林回归模型,该模型以其能够汇总多个决策树的预测结果而著称,从而提高了准确性并减少了过拟合现象。该模型实现了显著的R2相关系数26.1%,以及较低的平均绝对误差(MAAE)13.4%,优于其他模型。

洞见: 将社会情感融入ESG评估中,标志着一次重大进步,它反映了更广泛的社会价值观在企业评估中的体现。这种方法不仅量化了传统指标,还捕捉到了公众对企业行为的微妙看法,提供了对企业影响的更全面视角。

Scores

抖音推出抖音商城图像搜索功能,与谷歌和亚马逊竞争

抖音(TikTok)在征服社交媒体后,现在将目光投向了谷歌的搜索宝座。该平台正在抖音小店测试图像搜索功能,允许用户通过拍照或上传图片来寻找相似产品。这一工具最初在美国和东南亚地区提供,模仿了谷歌镜头和亚马逊的视觉搜索能力。

抖音此举具有战略意义,旨在将产品搜索从谷歌和亚马逊转移到自己的平台,用户可以直接购买商品。全球有超过1500万卖家,抖音小店被定位为重要的收入来源。尽管面临政治挑战,包括可能的美国禁令,抖音仍在积极扩展其电子商务功能,押注于通过其应用程序提高用户参与度和销售。

这一转变凸显了抖音不仅在娱乐领域,也在在线购物领域占据主导地位的雄心,挑战了多个领域的科技巨头。

Scores

人工智能语言模型对互联网广告和内容发现的影响

文章认为,AI语言模型对当前基于广告的互联网经济构成威胁。随着用户对广告的厌倦,这种模式的有效性逐渐减弱,对谷歌等巨头构成挑战。AI模型越来越多地用于搜索和内容推广,优先考虑质量相关性而非广告投入,改变了内容的排名和发现方式。这一转变可能边缘化小企业,有利于拥有定制AI模型的大企业。文章建议回归一个免费、无广告的互联网,强调内容质量和网络中立性,但同时警告AI可能带来的审查和偏见。

洞察:从广告驱动的互联网向AI塑造的互联网过渡,可能使内容可见性民主化,优先考虑质量而非营销预算。然而,风险在于AI评判“质量”的模糊标准,这可能嵌入偏见并限制多元声音。AI在提升内容发现方面的潜力,需通过透明度和伦理治理来平衡,以防止数字景观被少数强大利益所主导。

Scores

人工智能增强型外骨骼控制器降低能耗并提升移动性

人工智能增强型外骨骼控制器降低能耗并提升移动性

研究人员开发了一种AI增强型外骨骼控制器,无需个体校准,显著降低了能耗。这一进展在最近的《自然》杂志文章中详细介绍,有望提升人类移动能力,惠及工厂工人、宇航员及残障人士。

新型控制器由复杂神经网络驱动,通过数百万次模拟肌肉骨骼进化学习人类动作,无需人为测试即可提供流畅的扭矩辅助,支持行走、跑步和爬楼梯。这种“模拟学习”框架实现了创纪录的低代谢率,行走能耗降低24.3%,跑步降低13.1%,爬楼梯降低15.4%。

这一突破从模拟到现实的跨越,标志着可穿戴机器人领域的重要进步。它提供了一种可扩展的辅助机器人部署策略,可能彻底改变我们的移动和工作方式,使曾经虚构的节能人类任务成为触手可及的现实。

Scores

NVIDIA的Nemotron-4 340B:人工智能领域的新里程碑,利用合成数据

NVIDIA的Nemotron-4 340B:人工智能领域的新里程碑,利用合成数据

NVIDIA的Nemotron-4 340B模型,作为一款开创性的AI,利用98%的合成数据挑战GPT-4。该模型经过9万亿个令牌的训练,在多种任务中表现出色,支持50种语言和40种编程语言。在基准测试中,它超越了同类产品如Mixtral和Llama,在推理和编程方面展现出卓越性能。

该模型的架构采用了解码器专用的Transformer,并运用了因果注意和组查询注意等先进技术。通过在768个DGX H100节点上进行训练,它利用张量和流水线并行来提高效率。

Nemotron-4 340B的影响横跨多个领域:医疗保健、金融等,预示着在个性化医疗、欺诈检测和预测性维护等方面的进步,同时也引发了关于数据隐私和合成数据伦理影响的担忧。

NVIDIA通过Nemotron-4 340B的策略标志着向合成数据的转变,可能彻底改变AI模型的训练和部署方式。该模型不仅在当前基准测试中表现出色,也为未来的AI发展树立了新的标准。

Scores

GPTZero获得1000万美元A轮融资,用于AI内容检测

GPTZero,由Edward Tian和Alex Cui创立,作为一家AI检测初创企业蓬勃发展,在成立后的18个月内即实现盈利。其工具能区分AI生成的内容,吸引了数百万美元的收入,并最近获得了由Footwork的Nikhil Basu Trivedi领投的1000万美元A轮投资。

两位创始人自高中起就是朋友,他们将Tian最初的一个网页应用发展成为了一个强大的平台,得到了知名天使投资者的支持。GPTZero的快速增长,体现在年度经常性收入增长了500%,用户基数从100万激增至400万,凸显了其在市场上的吸引力。

Basu Trivedi在普林斯顿-硅谷活动中早期与Tian的接触证明是关键性的。他利用自己的网络和运营专长,采取了战略性方法,确保了这笔交易,使GPTZero在预融资前的估值约为5000万美元。

GPTZero在AI检测领域中脱颖而出,其卓越的准确性归功于广泛的数据访问和专有的LLM模型。该初创公司的目标不仅限于学术界,还瞄准了政府机构和AI训练数据提供商,倡导一个平衡的互联网,其中人类和AI内容负责任地共存。

创始人的愿景包括开发用于检测AI幻觉的工具,旨在保持在线内容的真实性。他们的倡议反映了对确保在日益由AI主导的环境中数字信息完整性的更广泛承诺。

Scores

工具

利用AI定制婚礼请柬:一种经济实惠的解决方案

Midjourney是一款AI工具,专门制作定制婚礼请柬,根据您的主题量身打造。媒体专家Rachel Kane推荐它,因其成本效益和节省时间的设计简洁性。

Scores

免费素材网的润饰工具:实时图像编辑与修复,快速修正

Freepik推出Retouch,一款图像修复工具。它能快速编辑图片,实时移除和调整细节,非常适合快速修正。

图像修复:一种技术,通过利用周围信息填补图像中缺失的部分。

Scores

革命化AI生成图像:借助创新AI工具提升真实感

革命化AI生成图像:借助创新AI工具提升真实感

法尔汉分享了一款AI工具,该工具能增强AI生成图像的真实感。这是一项突破,使得AI图像更加逼真。关注@mhdfaran获取更多见解。 AI工具:一种利用人工智能技术提升计算机生成图像真实感的软件。

Scores

卡带AI:您的音乐创作AI副驾驶 - 内部特惠

翻译磁带AI是一款利用人工智能生成音乐的工具,就像为您的音乐创造力配备了一个副驾驶。使用促销代码FARHANLOVESYOU访问他们的网站,享受特别优惠。 AI音乐生成:一种计算机使用算法创作音乐的过程,通常模仿人类作曲家的风格。

Scores

革命性AI图像编辑:基于命令的全方位转换

革命性AI图像编辑:基于命令的全方位转换

RIP Photoshop? 一款AI工具现已实现通过输入命令进行图像编辑,摒弃了传统技能的需求。只需描述所需改动,AI便会执行。这是照片处理领域的一次革命性转变,让所有人都能轻松上手。

Scores

革命化数据处理:AI工具在效率和准确性上超越Excel

革命化数据处理:AI工具在效率和准确性上超越Excel

摘要: "永别了,Excel!AI现已超越其上。这一工具更为强大,简化了数据处理。曾几何时强大的Excel,如今看来不过是个玩具。

解释: AI工具:利用人工智能的高级软件,用于执行任务,在数据分析方面往往超越人类的效率和准确性。

Scores

卢马实验室AI的梦想机器:即时图像转视频转换技术革新媒体

卢马实验室AI的梦想机器:即时图像转视频转换技术革新媒体

卢玛实验室AI在快速将图像转换为视频方面表现卓越。他们的工具“梦想机器”能在几秒钟内将静态图片制作成视频。科迪·库斯的展示突出了这一能力,强调了人工智能驱动的媒体创作的快速发展。

Scores

ChatLLM:利用AI效率简化研究论文摘要

摘要: AI简化了研究论文的消化过程。ChatLLM作为一种工具,能迅速将论文处理成易于理解的摘要,帮助学者们紧跟学术进展,免去了繁琐的阅读过程。

解释:

  • 大型语言模型(LLMs): 这些先进的AI系统旨在理解和生成类似人类的文本,有助于总结复杂的文档。
  • 向量存储库: 一种数据库,以允许高效搜索和检索的方式存储数据,特别适用于组织大量基于文本的信息。
Scores

多莫AI:在Discord上制作高质量动漫艺术与头像

Domo AI,一款AI艺术生成器,能够创作出高质量的动漫图像、头像及视频。可通过Discord平台访问,链接为http://Discord.gg/yk5hWAxKNR。

AI艺术生成器:一种利用人工智能技术创作视觉艺术的工具。 Discord:一个提供文字、语音和视频交流功能的平台。

Scores

《Midjourney AI:Discord上的多彩而有时略显怪异的图像生成器》

Midjourney AI,一款专属于Discord平台的图像生成器,拥有1990万成员,蓬勃发展。它要求用户具备精湛的提示设计技巧以获得高质量成果,尽管在处理复杂细节时略显不足。尽管如此,其生成的图像色彩鲜明、富有想象力,巧妙融合了旧互联网的魅力与人工智能的创新。这是一款独特且偶尔颇具挑战性的创意工具。

Scores

AI驱动的室内设计:融合技术与美学,实现沉浸式可视化

AI驱动的室内设计:融合技术与美学,实现沉浸式可视化

AI技术革新室内设计:Interior AI与LumaLabsAI携手合作,提供100%由AI生成的室内设计方案及虚拟漫游体验。这一技术与美学的融合,为建筑可视化和空间规划开辟了新天地。

AI虚拟漫游:一种虚拟模拟技术,允许观众如同身临其境般在数字渲染的空间中导航和体验。

Scores

美图AI视频工具moki:一键生成网文短剧与动画MV

美图公司推出AI视频工具moki,集成视频生成模型和工作流,一键制作网文短剧、故事绘本、动画短片及MV。文本驱动,全程可控。

解释:

  • AI视频制作工具:利用人工智能技术自动生成视频内容的软件。
  • 一键生成:用户只需简单操作即可完成视频制作。
  • 文本驱动:视频内容根据输入的文字脚本自动生成。
Scores

资源

Twitter: Farhan

再次遇见凯登AI:凯是一个AI教学助手,能节省您在课程规划、内容创作和评分上的时间。它整合了聊天、文件上传和一个强大的知识库,以优化您的工作流程。立即尝试:http://kaiden.ai

LangChain更新提升用户体验与教育

LangChain更新提升用户体验与教育

工作区优化组织结构。GenUI、游乐场和评估提示精炼用户交互。LangGraph深度学习课程提供教育。即将举行的聚会促进社区发展。进展清晰且功能性强。

Scores

Twitter: Cohere For AI

让我们使RLHF训练更加易于访问和实施。🔥介绍TRL中的RLOO——一种高效的GPU内存和实时RLHF训练算法。📝更多详情请阅读@aahmadian_和@vwxyzjn的这篇博文:https://huggingface.co/blog/putting_rl_back_in_rlhf_with_rloo

Twitter: ginobefun

《Learn Prompting》宣布:🚨《提示词报告》🚨——一份76页的综述,涵盖了1500多篇提示词相关论文,全面分析了所有提示技术、代理及GenAI。此报告由@learnprompting团队领衔,并得到@OpenAI、@Microsoft和@UofMaryland的同仁支持。

人工智能代理平台中的机遇:用户需求与创作者支持

在AI时代,简洁性占据主导。大多数用户追求与AI的无缝互动,绕过精心设计提示的复杂性。这种需求推动了AI代理平台的流行,用户可以在这些平台上轻松创建和部署代理。实例众多:某平台上的一个流行代理已被675,000人使用,另一个被250,000人使用,第三个则拥有超过4.1百万次的互动。

这些平台鼓励创作,提供曝光机会甚至金钱奖励。例如,百度在搜索结果中优先展示AI生成的内容,并为创作者提供可观的现金激励。货币化的潜力显而易见,一些代理已整合广告,展示出可行的收入来源。

作者强调参与AI代理的及时性,回顾过去的成功预测,并为新手提供教育资源。这些资源包括一门关于AI代理的基础课程、加入专注于AI应用的社区会员,以及一门全面介绍如何在职场中利用AI的课程。

总之,文章强调了当前利用AI代理平台的机遇,这一机遇由用户对简洁性的需求和平台对创作者的支持所驱动。

Scores

AI赋能:非程序员的H5游戏开发之旅与ChatGPT

在这篇文章中,一位非程序员产品经理利用人工智能,特别是ChatGPT,在一天之内开发了一款名为“龙舟接粽子大赛”的H5游戏。整个过程分为需求分析、设计、开发、测试和部署五个阶段,展示了AI如何作为一个多才多艺的合作伙伴,处理编码、设计和战略指导。

起初,产品经理与GPT互动,细化游戏概念并生成初始代码。尽管面临技术难题,GPT在迭代改进方面表现出色,根据反馈提出改进建议并迅速调整代码。设计阶段则利用了AI工具如DALL.E生成UI元素和Suno AI制作音乐,展示了AI在编码之外的能力。

测试过程中发现了一个重大错误,通过创新的问题解决方法而非传统调试得以解决。部署阶段最初尝试在Github上进行,后因可访问性问题转至腾讯云。

此项目强调了AI在赋予非技术个人产品开发能力方面的潜力,强调了迭代改进和敏捷问题解决。它挑战了技术开发中的传统角色,预示着一个AI增强人类创造力和执行力的未来。

关键工具包括ChatGPT用于编码和设计,Suno AI用于音乐,以及腾讯云用于部署。这一实验不仅验证了AI辅助产品开发的可行性,还突显了技术创造领域中AI作为关键合作伙伴的演变景观。

Scores

社媒言论

  1. 我有一条与人做生意的准则:说到做到。我有无限的耐心和理解……直到这条准则被打破。一旦打破,我便不再有耐心和理解。 —— Josh Pigford

  2. 快速切换AI服务与模型:对GPT-4o不满意?两步切换至Claude 3 Opus。 —— Daniel Nguyen

  1. 有趣的Tasha Keeney:我们的更新版特斯拉模型现已发布!https://www.ark-invest.com/articles/valuation-models/arks-tesla-price-target-2029 自动驾驶技术很可能成为历史上最具变革性的AI突破之一,对特斯拉股东而言意义重大。 —— Elon Musk
  1. 印度正站在一个独特的交汇点上,这是地球上其他国家无法比拟的:它拥有世界上最大的开发者群体,同时人工智能的新兴可能性也正在显现。如果这一伟大的交汇得以实现,将为印度带来深远影响的经济繁荣。据《印度斯坦时报》报道:印度的AI驱动数字增长正在上升,预计到2027年,印度将成为GitHub上最大的开发者社区,超越美国。GitHub首席执行官托马斯·多姆克表示:“印度有潜力在软件和AI领域引领世界。”详情请见:https://www.livemint.com/technology/tech-news/india-poised-to-lead-the-world-in-the-age-of-ai-says-github-ceo-11718103723388.html —— Thomas Dohmke

  2. 我是认真的,以前要从图像中获取这些数据所需的工作量简直疯狂。需要进行OCR调用,使用GPT尝试将OCR数据转换为可用的形式,还要依赖庞大的计算机视觉模型来识别物体……这一切都被一次对OpenAI端点的调用所取代。Josh Pigford表示:自从我上次接触@ToolstashApp已经过去了大约8个月,计算机视觉和AI领域发生了巨大变化,我打算从头开始重建它。OpenAI的视觉API已经取代了数千行代码和一个包含5万多件手动标注和分类工具的图像训练数据集。😂 —— Josh Pigford