时间:2024-07-02 来源:原创/投稿/转载作者:管理员点击:
近日,昆仑万维携手新加坡南洋理工大学成功开发了名为 Q * 的算法,能够显着提升现有大模型的推理能力。Q * 在不同数据集上帮助小模型达到参数量比其大数十倍甚至上百倍模型的推理能力,使得模型性能大幅提升,同时显着降低了计算资源的需求,为人工智能的广泛应用带来全新可能,开创了高效智能的新纪元。
具体来说,通过定义 Path Cost 的函数和 Accumulated Reward 的函数,实现了对历史状态收益和未来期望收益的综合考虑。在实验中,Q * 帮助不同模型在各个数据集上实现了显着的准确率提升,超越了一些知名模型。
目前,Q * 的研究还处于初级阶段,仍有改进空间。未来,昆仑万维将继续深入研究,提升国产开源模型的推理能力,为人工智能技术发展带来更多可能。
欢迎大家加入AiBase交流群, 扫码进入,畅谈AI赚钱心得,共享最新行业动态,发现潜在合作伙伴,迎接未来的赚钱机遇!。
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
2024年6月3日,昆仑万维宣布开源了一个性能强劲的2千亿稀疏大模型,名为Skywork-MoE。这个模型是在之前开源的Skywork-13B模型的基础上扩展来的,是首个完整应用并落地MoEUpcycling技术的开源千亿级MoE大模型。通过首创的非均匀TensorParallel并行推理方式,在FP8量化下,Skywork-MoE可以实现2200tokens/s的吞吐。
2024年6月3日,昆仑万维宣布开源2千亿稀疏大模型 Skywork-MoE , 性能强劲, 同时推理成本更低。Skywork-MoE 基于之前昆仑万维开源的 Skywork-13B 模型中间 checkpoint 扩展而来,是首个完整将 MoE Upcycling 技术应用并落地的开源千亿 MoE大模型,也是首个支持用单台4090服务器推理的开源千亿 MoE大模型。
在大模型技术迅速发展的背景下,昆仑万维公司开源了一个具有里程碑意义的稀疏大型语言模型Skywork-MoE。这个模型不仅在性能上表现出色还大幅降低了推理成本,为应对大规模密集型LLM带来的挑战提供了有效的解决方案。Skywork-MoE的开源为大模型社区带来了一个强大的新工具,有助于推动人工智能领域的发展,特别是在需要处理大规模数据和计算资源受限的场景中。
新加坡国立大学联合加州大学圣芭芭拉分校与奥克兰大学的研究人员提出了一种名为SymbCoT的全新推理框架,旨在提升大语言模型的符号逻辑推理能力。这一框架结合了符号化逻辑表达式与思维链,极大提升了推理的质量、鲁棒性与可信度。不同LLM的影响:SymbCoT与更先进的模型之间的协同效应更为显着。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:、挑战英伟达!高绩效者在GenAI采用中更具挑战性,但通过最佳实践取得成功。
在最近的一项由北卡罗莱纳大学教堂山分校和艾伦AI研究所共同进行的研究中,人工智能的道德推理能力再次得到了令人瞩目的展现。特别是OpenAI的新型聊天机器人GPT-4o,在道德推理和提供道德建议方面,已经超越了公认的道德专家。研究人员也提醒我们,尽管AI在道德推理方面表现出色,但在实际应用中仍需谨慎对待其建议,特别是在缺乏人类监督的情况下。
苹果一出手,在手机等移动设备上部署大模型不可避免地成为行业关注焦点。目前在移动设备上运行的模型相对较小,并且消耗大量内存,这在很大程度上限制了其应用场景。如果PowerInfer-2.0能够与手机厂商进一步紧密合作,相信可以加速相关技术走出实验室,落地到各种真实场景。
展会预告诚挚邀请您参加在上海新国际展览中心举办的老博会!我们在W3馆C31站台展出万维感知革命性AI健康传感解决方案,覆盖血压无感连续监测,心率呼吸率无感监测解决方案。期待与您共商合作,携手开启智慧养老及医疗康复新篇章。我们期待在即将到来的AID展会上,与各界合作伙伴共同探讨智能感知技术在康养领域创新应用以及康养产业的未来发展。
快科技6月17日消息,据媒体报道,日本TDK公司在电池技术革新领域取得了重大突破,成功研发出一种全新的全固态电池材料。据悉,这种创新材料在电解质上的应用,使得电池的能量密度相较于传统液态电池实现了惊人的提升,高达100倍的飞跃。全固态电池作为下一代电池技术的代表,其核心优势在于将传统液态电解质替换为固态,此举不仅显着降低了因液体泄漏而带来的安全风险,更为电池性能的全面升级铺平了道路。TDK公司在此领域的深入研究尤为引人注目。他们成功研制出了一种高性能的氧化物类新材料,尽管具体材料细节尚未公开,但其显着提升能
【新智元导读】24点游戏、几何图形、一步将死问题,这些推理密集型任务,难倒了一片大模型,怎么破?北大、UC伯克利、斯坦福研究者最近提出了一种全新的BoT方法,用思维模板大幅增强了推理性能。Llama3-8B在BoT的加持下,竟多次超越Llama3-70B!大语言模型不擅长推理怎么办?用思维缓冲区来解决!最近,北大、UC伯克利、斯坦福的研究人员提出了一种元缓冲区。他担任/曾担任中�
WAKE UP MOTHAF$R是一个提供个性化AI语音唤醒服务的网站,模仿知名人物David Goggins的声音,帮助用户在早晨醒来。该工具由David Goggins的粉丝们创建,并非由David Goggins本人或其团队正式支持。
Gemma是由Google开发的一系列轻量级、先进的开放模型,基于与Gemini模型相同的研究和技术构建。它们是文本到文本的解码器仅大型语言模型,适用于多种文本生成任务,如问答、摘要和推理。Gemma模型的相对较小的尺寸使其能够在资源有限的环境中部署,如笔记本电脑、桌面或您自己的云基础设施,使每个人都能接触到最先进的AI模型,并促进创新。
Gemma-2-27b是由Google开发的一系列轻量级、先进的开放文本生成模型,基于与Gemini模型相同的研究和技术构建。这些模型专为文本生成任务设计,如问答、摘要和推理。它们相对较小的体积使得即使在资源有限的环境中,如笔记本电脑、桌面或个人云基础设施上也能部署,使先进的AI模型更易于访问,并促进创新。
Free AI Hunter是一个致力于收集和提供2024年免费AI API以及付费选项的综合性平台。它涵盖了自然语言处理、计算机视觉、机器学习等多种AI API,定期更新数据库以确保信息的最新和准确性。用户可以通过搜索功能轻松找到满足特定需求的AI API。
Skyvern是一款基于AI技术的浏览器自动化工具,它利用计算机视觉和自然语言处理技术来理解网页内容,实现对任何网站的自动化操作。Skyvern接受自然语言指令,能够执行复杂的目标任务。作为API优先的产品,Skyvern能够在云端执行工作流程,支持同时运行数百个工作流程。它还具备可解释AI、代理网络、验证码支持、用户认证、数据提取等功能,为用户提供了一种高效、可扩展的自动化解决方案。
MakeTheDocs是一个利用人工智能技术将视频内容自动转换成文档页面的工具。它通过上传视频,快速生成高质量的文档,帮助用户节省编写文档的时间,从而专注于创新和提高工作效率。产品背景信息表明,公司致力于通过自动化减少手动文档编写的时间和成本,同时保证文档质量。产品定位于需要快速生成文档的企业和个人,提供不同层级的订阅服务,以满足不同用户的需求。
The Fittest是一个致力于健康和健身的应用程序,提供用户终身访问权限,以实现健康生活。利用 AI 将您的健身之旅游戏化。它可能包含了锻炼指导、饮食建议、健康追踪等功能,旨在帮助用户达到最佳的身体状态。
Replyhub是一个SaaS平台,专注于在Reddit上追踪关键词,通知用户相关帖子,并提供自动回复来捕获潜在客户。它通过自动化监控和实时通知,帮助用户高效地参与Reddit上的讨论,提升产品曝光度和销售机会。
AiTerm是一款AI终端助手,通过自然语言处理技术将用户的自然语言命令转换为可执行的命令行指令,辅助开发者和命令行用户直接在终端中实现需求。它具有命令建议、IDE风格的自动补全、组织化的工作流程等功能,旨在提升终端的工作效率和开发体验。AiTerm使用Go语言开发,具有高性能和轻量级的特点,并且非常注重用户隐私,不存储任何终端内容。
Gemma-2-9b-it是由Google开发的一系列轻量级、最先进的开放模型,基于与Gemini模型相同的研究和技术构建而成。这些模型是文本到文本的解码器仅大型语言模型,以英文提供,适用于问答、摘要和推理等多样化文本生成任务。由于其相对较小的尺寸,可以在资源有限的环境中部署,如笔记本电脑、桌面或个人云基础设施,使先进的AI模型更加普及,促进创新。
Starship 是一个快速、可定制的命令行提示工具,它利用 Rust 语言的优势,提供了一个轻量级且功能丰富的命令行界面。它支持多种操作系统和常见的 shell,如 Bash、Zsh、Fish 等,允许用户根据自己的需求进行个性化配置。Starship 的设计注重速度和安全性,是开发者提升工作效率的有力助手。
ClotheDreamer是一个基于3D高斯的文本引导服装生成模型,能够从文本描述生成高保线D服装资产。它采用了一种新颖的表示方法Disentangled Clothe Gaussian Splatting (DCGS),允许服装和人体分别进行优化。该技术通过双向Score Distillation Sampling (SDS)来提高服装和人体渲染的质量,并支持自定义服装模板输入。ClotheDreamer的合成3D服装可以轻松应用于虚拟试穿,并支持物理精确的动画。
360LayoutAnalysis是由360 AI研究院开发的一系列文档分析模型和数据集,专注于文档版式分析,即从扫描的文档图像中识别和提取文本、图像、表格和其他元素。这项技术对于自动化文档处理、电子数据交换、历史文档数字化等领域至关重要。模型采用深度学习和模式识别技术,通过训练数据集提高对文档结构的理解能力,尤其注重段落的标注,以支持文本的语义理解和信息提取。
Arcee Spark是一个7B参数的语言模型,它在紧凑的包体中提供高性能,证明小型模型也能与大型模型相媲美。它是7B-15B范围内得分最高的模型,并且在MT-Bench基准测试中超越了GPT 3.5和Claude 2.1等更大模型。它适用于实时应用、边缘计算场景、成本效益高的AI实施、快速原型设计和增强数据隐私的本地部署。
StableFace是一个基于Stable Diffusion 2.1的开源项目,旨在通过一系列简单的Jupyter Notebook教程,帮助用户理解Stable Diffusion的关键方面,如采样、架构、CFG、注意力层、逆向调度、关键点反转、图像重建和prompt2prompt编辑,以实现超现实的面部编辑效果。该项目适合那些对生成式AI和面部图像编辑感兴趣的开发者和研究人员。
Mann-E Dreams是Mann-E平台推出的基于SDXL的最新模型,该平台是伊朗的生成性AI初创公司。该模型利用数千张中途生成的图像,实现高质量图像的生成。开发团队由Mann-E的创始人兼CEO Muhammadreza Haghiri带领,经过数月的数据收集、标记和训练,模型几乎无审查,并通过Automatic1111进行了测试。
Gemma 2是Google开发的一系列轻量级、先进的开放模型,基于与Gemini模型相同的研究和技术构建。它们是文本到文本的解码器仅大型语言模型,仅提供英文版本,具有开放的权重,适用于预训练变体和指令调整变体。Gemma模型非常适合各种文本生成任务,包括问答、摘要和推理。其相对较小的体积使其能够部署在资源有限的环境中,如笔记本电脑、桌面或您自己的云基础设施,使先进的AI模型的访问民主化,并帮助为每个人促进创新。
Persona Hub 是腾讯AI实验室发布的一个大规模合成数据集,旨在促进以人物角色为驱动的数据合成研究。该数据集包含数百万不同人物角色的合成数据样本,可用于模拟真实世界用户的多样化输入,对大型语言模型(LLM)进行测试和研究。
Rakis是一个完全在浏览器中运行的去中心化推理网络。它利用区块链技术,允许节点之间进行AI模型的推理请求和结果共享,无需服务器即可实现AI模型的分布式执行。Rakis通过使用浏览器作为节点,支持WebGPU兼容平台,使得普通用户也能参与到AI模型的推理过程中。项目开源,强调透明度和可验证性,旨在解决去中心化AI推理中的确定性、可扩展性和安全性问题。
EgoGaussian是一项先进的3D场景重建与动态物体追踪技术,它能够仅通过RGB第一人称视角输入,同时重建3D场景并动态追踪物体的运动。这项技术利用高斯散射的独特离散特性,从背景中分割出动态交互,并通过片段级别的在线学习流程,利用人类活动的动态特性,以时间顺序重建场景的演变并追踪刚体物体的运动。EgoGaussian在野外视频的挑战中超越了先前的NeRF和动态高斯方法,并且在重建模型的质量上也表现出色。