跳到主要内容

科技迷周刊(2024-07-19) : 基于WebRTC的点对点文件共享使用Firebase

基于WebRTC的点对点文件共享使用Firebase

ShareDrop 简化了文件共享过程。与 AirDrop 类似,它直接在设备之间传输文件,绕过服务器。ShareDrop 使用 WebRTC 进行安全的点对点传输,并利用 Firebase 进行协调。

如果设备处于同一网络中,无需进行任何设置。在每个设备上打开 sharedrop.io,它们即可连接。ShareDrop 也支持跨不同网络的传输。

WebRTC 允许浏览器和应用之间进行安全的数据交换。Firebase 通过实时数据库支持应用开发。

Scores

科技新闻

YouTube音乐推出AI电台和歌曲识别功能

YouTube Music推出AI生成的电台和歌曲识别工具。美国的高级用户可以通过描述音乐偏好来创建自定义电台。一项新功能允许用户通过哼唱或唱歌来识别歌曲,扩展了Shazam的能力。这两项工具旨在增强个性化音乐发现体验。

微软设计器应用在iOS和Android平台上线

微软的Designer应用现已登陆iOS和Android平台,用户可以通过文本提示创建图像和设计。该应用支持超过80种语言,提供模板以激发创造力,并允许进行图像编辑和重塑。未来的更新将包括背景替换功能以及与Windows 11上的Microsoft Photos更深层次的整合。此工具旨在简化各种微软平台上的设计任务。

AI配音革命化电影产业

Flawless,一个由电影制作人和科学家合作的团队,似乎已经攻克了内容配音中的“恐怖谷”难题。他们制作出了世界上第一部由AI驱动的配音电影。这项技术模仿人类语音的逼真程度,几乎让人难以分辨。

“恐怖谷”指的是当我们遇到某物非常接近,但又并非完全像真人时产生的那种诡异感觉。Flawless的这一突破预示着未来AI可能会取代传统的配音演员,引发关于创意领域中真实性和就业问题的讨论。

Qwen-2-72B:大型语言与多模态模型的一次突破

Qwen2,一系列新型大型语言和多模态模型,超越了其前代及竞争对手。核心模型Qwen2-72B在多项测试中表现优异:MMLU得分84.2,GPQA得分37.9,HumanEval得分64.6,GSM8K得分89.5,BBH得分82.4。该模型支持30种语言,从英语到中文。

模型权重及资源在Hugging Face、ModelScope和GitHub上免费提供,支持定制与部署。

推进图像生成与DiT-MoE:AI效率的突破

DiT-MoE 通过使用稀疏网络扩展扩散Transformer,这些稀疏网络在性能上与密集网络相匹配。它具备共享专家路由和平衡损失功能,减少了冗余。在图像生成中,专家选择侧重于空间位置和去噪步骤,而非类别条件。随着层数的加深,专家选择逐渐分散。早期步骤中专家专业化集中,后期步骤则更加均匀。这种设置在减少计算量的同时,达到了与密集网络相媲美的结果。DiT-MoE 在图像合成质量上创下新纪录,高效处理了165亿参数。

NIPT在Duchenne肌营养不良症检测中的进展

基于新NIPT的方法揭示了杜兴氏肌肉萎缩症基因中的33种致病性拷贝数变异。

NIPT,即非侵入性产前检测,扫描母体血液中的胎儿DNA。这项技术能够在不伤害胎儿的情况下发现遗传异常。

杜兴氏肌肉萎缩症是一种严重的肌肉萎缩疾病,源于肌营养不良蛋白基因的突变。这种新方法能够识别与该疾病相关的特定基因改变。

这些发现可能有助于改进产前诊断,指导更具针对性的干预措施。早期检测意味着早期治疗,可能会改善患者的预后。

这项研究标志着遗传检测精确度的一大进步。它强调了NIPT在医疗保健领域不断发展的能力。

本质上,这种方法不仅提高了诊断的准确性,还为受遗传疾病影响的人们带来了更好的未来。

李飞飞博士的世界实验室:一家价值10亿美元的AI初创公司

被称为"AI教母"的李飞飞博士创立了World Labs。这家初创公司旨在提升AI的视觉处理和推理能力。成立仅四个月,估值已达10亿美元。由Andreessen Horowitz和Radical Ventures投资。

李飞飞的ImageNet,作为计算机视觉的关键数据集,推动了AI的繁荣。她还为政策制定者提供AI监管方面的建议。2021年,她被任命为美国国家AI研究任务组的成员。

洞察:李飞飞的工作使AI更接近类人智能。她的影响力塑造了技术和政策两个领域。

数据果汁沙盒:增强多模态人工智能开发

文章介绍了Data-Juicer Sandbox,这是一个用于改进多模态AI模型的工具。它结合了数据和模型开发,加快了改进速度并提升了性能。在高级模型上测试的“探测-分析-优化”方法提高了结果,超越了基准。详细测试的见解突出了数据质量和多样性的重要性。该工具的资源可在GitHub上获取,旨在推进对多模态和生成建模的理解和创新。

多模态AI模型:这些是能够跨不同类型的数据(如文本、图像和声音)处理和生成信息的AI系统。

“探测-分析-优化”:一种工作流程,首先测试(探测)模型,然后分析结果,最后根据这些见解优化模型。

Toddle 筹集 430 万美元,借助无代码平台革新软件开发

Toddle,一家丹麦初创公司,旨在通过无代码平台彻底改变软件构建方式。由Andreas Møller和Kasper Svenning创立,Toddle提供了一个可视化界面,让设计师和开发者能够实时协作。该平台模仿了React等JavaScript框架的功能,允许用户无需编码即可创建SaaS应用。

Toddle的方法将设计和开发相结合,使团队能够同时处理UI、内容和应用逻辑。平台支持外部集成,用于数据库和认证等后端功能,避免了单一解决方案的局限。

定价从免费层级开始,适用于开源项目,托管在Toddle的域名上。付费选项解锁了如自定义域名和增加存储等额外功能。

最近,Toddle获得了430万美元的种子资金,由Inventure领投。公司计划将其平台开源,允许开发者自行托管和修改代码。此举可能会显著影响软件开发工具的可访问性和定制性。

中国计划2027年发射长征十号火箭,目标2030年前载人登月。

中国计划2027年发射长征十号火箭,目标2030年前载人登月。

中国计划2027年发射长征十号火箭,目标2030年前载人登月。火箭运载能力70吨,地月转移轨道能力27吨。载人登月方案:两枚火箭分别送月面着陆器和载人飞船至地月转移轨道,环月轨道交会对接,航天员登月考察、采集样品,后返回地球。

解释:

  • 地月转移轨道:从地球到月球的飞行路径。
  • 环月轨道:月球周围的轨道。
  • 交会对接:两个航天器在太空中的连接。

欧盟《人工智能法案》生效:全球AI监管新篇章

欧盟《人工智能法案》生效:全球AI监管新篇章

欧盟《人工智能法案》8月1日生效,全球首个全面AI监管法案。旨在保护公民,促进创新,确立欧洲AI领域领先地位。法案分阶段实施,高风险应用如信用评分、员工监控受严苛监管。

企业面临合规成本上升,需投资新规定,任命专员研究合规政策。违规企业罚款高达3500万欧元或年收入7%。

欧盟AI法案影响波及全球,尤其中美。中国已发布生成式AI服务管理暂行办法,美国也在推进AI监管立法。

解释:

  • GDPR:通用数据保护条例,欧盟数据保护法规。
  • AI法案:人工智能法案,欧盟针对AI的监管法规。
  • 沙盒:监管环境,允许AI系统在监督下测试。
  • 生成式AI:利用算法生成内容的人工智能。

OpenAI的秘密项目“Strawberry”旨在增强AI推理能力。

OpenAI的秘密项目“Strawberry”旨在增强AI推理能力。

OpenAI正在秘密开发一个名为“Strawberry”的项目,旨在提升AI的推理能力。该项目可能使AI能够解决复杂的数学和科学问题,进行前瞻性规划,并在线进行“深度研究”。

Strawberry的前身Q*已经在解决棘手的科学和数学挑战方面显示出潜力。OpenAI认为掌握数学是增强AI推理能力的关键,有可能与人类智能相媲美。

该项目非常机密,甚至在OpenAI内部,细节也鲜为人知。然而,线索表明Strawberry可能采用一种“后训练”方法,即在初始训练后对模型进行精炼,以在特定任务上表现出色。这种方法与斯坦福的“自学推理者”相呼应,理论上可以将AI推向超人智能水平。

OpenAI的AI发展路线图包括五个阶段,从聊天机器人到能够组织任务的AI。Strawberry很可能是迈向第二阶段的步骤,即AI成为“推理者”,具备人类水平的问题解决能力。

如果成功,Strawberry可能会重新定义AI的能力,使其能够进行重大的科学发现,开发新软件,并自主执行复杂任务。这一进步将使我们更接近通用人工智能(AGI)。

Shaped 为自助推荐和搜索服务筹集了 800 万美元

Shaped,一家科技初创公司,刚刚筹集了800万美元。他们的目标是简化任何网站的个性化推荐,包括市场、商店、社交媒体平台等。

该平台以开发者为中心,提供数据源、集成方法和语言模型的灵活性,如Llama、CLIP、BERT等。

CEO Tullie Murrell和CPO Daniel Camilleri共同创立了Shaped。两人均拥有从Meta/Facebook到Uber和Afterpay的坚实技术背景。

最初,Shaped专注于视频个性化,但在Y Combinator之后,他们扩展到了其他媒体类型——语言、视频、音频。

Shaped与各种数据源集成,从Databricks到Google Analytics。这些丰富的数据有助于构建定制的推荐系统。

重点仍然是开发者体验,提供工具和数据来构建和测试系统。一个仪表板有助于模型测试和理解推荐。

最近,Shaped深入探索了搜索领域。利用对用户和内容的语义理解,他们旨在成为一个完整的发现平台。

A轮融资由Madrona Ventures领投,其他参与者包括Y-Combinator和科技行业资深人士。

本质上,Shaped正在普及高级个性化,使其对没有庞大AI团队的企业也变得触手可及。这是科技领域的一个有前景的举措。

英伟达、SK海力士与台积电联盟加速下一代AI发展

英伟达、SK海力士与台积电联盟加速下一代AI发展

SK海力士、台积电和NVIDIA形成战略联盟。他们旨在开发对AI进步至关重要的HBM4内存。该联盟将在SEMICON上揭晓。HBM4承诺在AI处理效率上实现显著提升。SK海力士计划整合内存与逻辑半导体,绕过传统封装方式。此举可能彻底改变AI硬件。联盟目标于2026年启动生产,与NVIDIA下一代Rubin架构同步。这一合作标志着在AI市场中的积极姿态,为竞争对手留下有限空间。

工具

Apache brpc:高性能网络框架全面概览

  • Apache维护的开源网络服务框架。
  • 超过3,200次提交,活跃开发中。
  • 支持Java、Python,现代构建工具。
  • 详细文档,持续集成测试。
  • 鼓励贡献,属于Apache生态系统的一部分。

解释:

  • 持续集成(CI): 当代码变更时自动运行测试的自动化测试过程,确保代码质量。
  • Bazel和CMake: 帮助管理和自动化软件项目构建过程的构建工具。

提升AI效率:FlashAttention

FlashAttention,由Dao等人提出,加速了AI的注意力机制。它具有内存效率高、IO感知等特点,并在NeurIPS 2022上展示。FlashAttention-2,同样由Dao开发,增强了并行性和工作分配,计划在ICLR 2024上发布。这两个版本都旨在加快和简化AI处理。

在AI中,“注意力”指的是模型关注数据的具体部分。“IO感知”优化了输入输出数据流。“并行性”同时运行任务,提高了速度。“工作分区”有效地将任务划分。

Tokio: 一个高性能、可靠且可扩展的 Rust 运行时

Tokio-rs/Tokio:Rust异步应用运行时。快速、可靠、可扩展。零成本抽象,接近底层性能。Rust的类型系统确保线程安全。轻量级,自然处理背压。自2016年起公开仓库,组织良好。适合高性能、并发Rust开发。

零成本抽象:提供高级功能而没有性能开销的编程结构,如同用底层代码编写一般。

背压:一种允许系统调节数据流量的机制,防止过载并确保平稳运行。

全面概述 NixOS/nixpkgs 仓库

全面概述 NixOS/nixpkgs 仓库

NixOS/nixpkgs 包含了超过 100,000 个软件包。由 Nix 管理,它处理依赖关系和多软件版本而不产生冲突。这个仓库是 NixOS 的核心,NixOS 是一个围绕 Nix 构建的操作系统。自 2012 年起公开,它包括文档、库和配置文件。

Nix 包管理器:一个确保软件安装隔离和可重现的工具,防止不同软件版本间的冲突。

NixOS:一个使用 Nix 进行包管理的 Linux 发行版,确保系统配置的可重现性和可靠性。

高斯如何利用最小二乘法和正态分布找到失踪的谷神星

高斯,数学家,利用误差分布规律找到了失踪的谷神星。他推导出了正态分布公式,关键是最小二乘法。这种方法通过最小化预测值与实际值之间的误差平方和,优化数据拟合。

正态分布,又称高斯分布,描述随机变量在均值周围的对称分布。高斯的这一发现,不仅解决了天文学问题,更在统计学中广泛应用。

解释:

  • 正态分布:一种数学模型,描述数据如何在平均值周围分布,形状像钟。
  • 最小二乘法:一种数学优化技术,通过最小化误差的平方和来寻找数据的最佳函数匹配。

PDF-Extract-Kit:学术与财经文档高级PDF解析工具

PDF-Extract-Kit:学术与财经文档高级PDF解析工具

PDF-Extract-Kit,由Tom Huang开发的开放源代码工具,擅长解析PDF文件。它具备先进的布局和公式识别模型,在准确性方面树立了新标准。非常适合学术和金融文档,轻松处理表格、图像和公式。该工具简化了提取过程,使复杂的PDF数据易于访问。

布局识别:识别PDF中文本和图像的结构。 公式识别:检测并提取文档中的数学方程。 SOTA:State Of The Art,指在给定技术中的最高性能水平。

快速创建从简历到专业作品集网站

快速创建从简历到专业作品集网站

Getaresume 简化简历集创建。输入简历数据,获取网站。无费用,流程快捷。

此工具使竞争环境平等化。任何有网络访问权限的人现在都可以建立专业简历集。它节省时间,让用户专注于他们的工作,而不是展示。

简历集: 在线展示的工作样本和成就集合,用于展示技能和经验。

民主化: 使某事物对所有人开放,不仅仅是少数人。

AI驱动的网页数据提取在SEO和电子商务中的应用

AI驱动的网页数据提取在SEO和电子商务中的应用

Nimble API实时流式传输网络数据。它采用AI进行高效的网页抓取,现代代理确保匿名性,并自动化数据结构化。非常适合SEO、电子商务和AI项目。保证高准确性和可靠性。

AI驱动的抓取:利用人工智能导航并从网站提取数据。

现代代理:隐藏您的IP地址,确保安全和私密的数据收集。

OceanBase:一种可扩展且经济高效的开放源代码数据库解决方案

OceanBase:一种可扩展且经济高效的开放源代码数据库解决方案

OceanBase:自主研发的开源数据库。简化了从单机到分布式系统的扩展。高效处理海量数据增长。

特点:

  • 成本效益: 仅为MySQL成本的25-40%。
  • 可扩展性: 垂直和水平扩展无需停机。
  • 用户友好: 兼容MySQL语法。

部署:

  • 单机: 适用于小型设置。
  • 分布式: 随数据增长扩展,采用1-1-1或3区域设置。

入门:

  • 安装: 简单的Linux命令。
  • 支持: 活跃的社区和技术支持。

洞察: OceanBase为企业提供了一个强大的解决方案。经阿里巴巴和蚂蚁金服验证,可靠处理极端数据负载。

解释:

  • 开源: 软件免费提供,源代码可访问以进行修改。
  • 分布式数据库: 数据库分布在不同计算机上,提高性能和可靠性。
  • MySQL: 一种流行的开源关系数据库管理系统。

AI增强协作平台:Miro的智能画布

AI增强协作平台:Miro的智能画布

Miro 的平台将 AI 与团队协作相结合。AI Sidekicks,即数字助手,提供实时反馈。智能模板自动化项目框架。这种设置提升了创新和效率。

AI Sidekicks:帮助用户提供即时建议和更正的计算机程序。

智能模板:预先制作的项目结构,引导用户通过标准流程,节省时间并确保一致性。

AI驱动编码助手:分析、预览、文档

AI驱动编码助手:分析、预览、文档

AI Magicx Coder 提升生产力,它检查代码、提供实时预览并自动生成文档。免费试用。

智能代码分析发现错误并提出改进建议。实时预览展示代码的外观和功能。自动化文档编写代码描述,节省时间。

解释:

  • AI Magicx Coder: 一种帮助程序员自动分析和改进代码的软件工具。
  • 实时预览: 代码编写过程中即时显示的视觉和功能展示。
  • 自动化文档: 自动生成关于代码工作原理的书面解释。

AI驱动视频创作工具,简化短片制作

AI驱动视频创作工具,简化短片制作

Ssemble采用AI进行视频编辑。用户上传素材后,AI负责剪辑、裁剪、添加字幕、B-roll、转场、音效、缩放动画以及行动号召。无需编辑技能。

这一工具使视频制作民主化。它适合那些没有编辑经验但追求专业效果的人。AI自动化确保了一致性和效率。

B-roll:用于补充主视频的额外素材,增强视觉叙事效果。

行动号召:鼓励观众采取特定行动的提示,如订阅或访问网站。

资源

Twitter: Pat Walls

@ericsmith1302 在短短6个月内打造了令人惊叹的作品!50多个微型SaaS创意,赚取了数百万:https://www.starterstory.com/micro?utm_source=twitter&utm_campaign=autoshorts

Twitter: Mr Bear

我以前说, 作为创业者,要把80%的时间拿来去卖你的产品, 剩下的20%的时间才是你coding的时间。 其实, 对于独立内容创作者, 我觉得也是这样的, 快速学习关于营销增长方面的方法和工具,以及成熟的经验, 这个专栏真的可以。 怒推这个专栏, 我感觉非常不错, 都是教你实际操练的,…

Twitter: Justin Welsh

我热爱单干创业,因为它给了我灵活性。我可以通过外包、利用技术和将工作限制在最重要的事情上来选择家庭而不是事业。以下是如何成为一名(成功的)单干创业者:https://justinwelsh.link/7.16.24.x3

Twitter: 知识分享官

偶然间又发现一个非常实用的网站,不敢私藏,分享给大家⬇️网站名:Devhints。这是一个可以快速生成速查手册的网站,提供各种编程语言、框架和工具的简洁参考,帮助快速找到所需的主要信息,提高开发效率。内容不断更新,涵盖广泛,从常见的编程语言如 Python、JavaScript,到工具如 Git、Docker…

Twitter: viggo

🚀✨ 发现AI知识库的宝藏! 我刚刚用 http://Pintree.io 快速做了一个AI知识库导航网站,收集了各种AI相关的知识库和教程,内容丰富,资源齐全! 链接在这里👇🏻,能逛一天https://viggoxs.github.io/pintree/ #AI #KnowledgeBase #Tutorials #MachineLearning #DeepLearning