20B量级大模型性能媲美Llama2-70B！完全开源从基座到工具全安排明白了_开云体官网登录

产品中心

当前位置：

20B量级大模型性能媲美Llama2-70B！完全开源从基座到工具全安排明白了

来源：开云体官网登录发布时间：2023-12-25 01:34:48 1019

详细内容

【新智元导读】国产模型开源纪录，又被刷新了!上海AI实验室等机构开源的InternLM-20B，竟然能和Llama2-70B打个平手?就在刚刚，国内开源模型参数量纪录，又被刷新了!9月20日，上海人工智能实验室（上海AI实验室）与商汤科技联合香港中文大学和复旦大学，正式开源了200亿参数的Inte

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了能够更好的保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，稳定性很高，让您的云端之旅更加畅享。快来腾讯云选购吧！

国产新标杆:免费可商用的200亿参数大模型，来了!书生·浦语大模型20B版本正式对外发布，一举刷新国内新一代大模型开源纪录。它由上海人工智能实验室与商汤科技联合香港中文大学和复旦大学共同推出。正如林达华所说:这或许才是当下大模型趋势里，大家最应该“卷”的方向。

开源界最强的中英双语大模型，悟道·天鹰34B，来了!有多强?一言蔽之:不仅模型够大够能打还一口气送上整套“全家桶”级豪华周边。能有如此大手笔的，正是中国大模型开源派先锋——智源研究院。Aquila2模型全系开源地址:开源仓库地址:

最强中文版LLaMA-2来了!15小时训练，仅需数千元算力，性能碾压同级中文汉化模型，开源可商用。LLaMA-2相较于LLaMA-1，引入了更多且高质量的语料，实现了显著的性能提升，全面允许商用，进一步激发了开源社区的繁荣，拓展了大型模型的应用想象空间。ColossalAI云平台现已开启公测，注册就可以获得代金券，欢迎参与并提出反馈。

从头预训练大模型被认为需要高达5000万美元的投资，这让很多开发者和中小企业望却步。Colossal-LLaMA-2的出现降低了大模型的门槛。该方案业已应用到多个行业领域，构建垂类大模型并取得良好效果。

昆仑万维表示，其自研的天工大模型在BenchmarkGSM8K测试中取得了80%的正确率，超过了GPT-3.5和LLaMA2-70B，达到了全球领先水平，接近于GPT-4。天工大模型还在MMLU、C-EVAL、HumanEval等多个数据集上表现出色，准确率均高于其他主流大模型。天工大模型目前仍处于内测阶段，将持续提升技术实力，为用户和公司可以提供强大的智能化助力。

ROUGE矩阵是评估大型语言模型的性能和能力的工具。在自然语言处理领域中，评估模型的性能很重要，但由于语言输出的不可预测性和人类语言的复杂性，传统的机器学习评估方法存在局限性。ROUGE矩阵是评估语言模型摘要能力的重要工具，通过一直在改进和结合其他指标，可以更准确地评估语言模型的性能。

大语言模型黑盒，居然被CMU等机构的学者打破了?他们发现，LLM内部有可解释的表征，如果撒谎能被测谎仪检测出来!最近，来自CAIS、CMU、斯坦福、康奈尔、马里兰、宾大等机构的学者又有了令人震惊的发现——大语言模型，并不仅仅是黑匣子，或者难以理解的庞大矩阵。在它们内部，具有可解释的内部表征。CMU等机构研究者的探索也告诉我们，人类对于AI系统的理解和控制会越

训练大模型，几千块就能实现了!现在，15小时、几千块钱、85亿token数据，即可训出中文LLaMA2。综合性能达到开源社区同规模从头预训练SOTA模型水平。更多应用场景、不相同的领域、不同版本的模型、企业私有化平台部署等正不断迭代。

微软研究人员最近在一篇论文中提出了一个新的语言模型Phi-1.5，该模型的参数量仅有13亿。研究人员主要关注Phi-1.5在常识推理方面的表现，因为这是对语言模型能力的重要考验。本研究表明，相比单纯追求模型规模，如何获取高质量训练数据可能更重要，这为未来语言模型研究提供了新的思路。

Meta最近发布了Llama2LongAI模型，该模型在一些任务上超越了GPT-3.5Turbo和Claude2。通过改进训练方法和编码技术，Meta的研究人员提高了这个AI模型的性能，使其能够更好地处理长文本和复杂任务。强调了合作的重要性，指出不是每个企业都拥有高级的数据工程和数据科学技能，因此就需要与具有有关技术和深刻了解整个领域的合作伙伴合作来解决这一问题。

NSFWLover是一个能与虚拟女友和虚拟男友进行AI爱情聊天的最佳AI站点，能够直接进行角色扮演，与浪漫的聊天机器人和AI女孩交谈，无限制，没有过滤。该产品提供多种虚拟人物供用户选择，每个人物都有自己独特的故事和特点。用户都能够根据自己的喜好和需求选择正真适合的虚拟伴侣。

如果您需要一个快速准确的AI检测工具，您来对地方了。我们的AI内容检测器可以准确地显示出文本中是否有任何部分是由AI生成的。使用它并自行检查！

Reference Finder是一个帮助学生快速找到可靠引用来源的工具。它能够给大家提供一系列与您的论文主题相关的可靠来源，帮助您快速完成论文。使用我们的引用查找工具，轻松快捷地撰写论文。

Fast HW是一款AI写作助手，帮助你轻松引用科学文献并组织你的文章。它可提供写作建议、自动引用文献、优化语言表达等功能，让你的写作更加高效和专业。定价灵活多样，适用于大学生和专业写作人士。

CoGrader 是一款教师评分助手，通过 AI 技术帮助教师高效评分，提供即时和全面的反馈，节省 80% 的评分时间。支持 Google Classroom 集成，可以导入和导出作业。通过一系列分析学生数据，提供班级分析和挑战点，支持多语言评分。

Rex.fit是一个由AI驱动的营养和健身教练，旨在根据自己的独特目标（如长寿、减肥或增肌）量身定做健康转型方案。通过WhatsApp与Rex交流，用户都能够记录餐食、获取个性化的锻炼建议、查看日常报告和反馈，从而在减重、健身或提高生活品质方面取得显著进展。

Aha Vector Search是一个高性能、低成本的端到端向量搜索服务。它提供了一种快速构建端到端向量搜索的方法，帮助用户以更低的成本实现高效的搜索体验。

SparkSocial是一款AI驱动的社会化媒体营销工具，通过监控关键词、实时追踪、情感分析和全面报告，帮助用户更接近受众。它提供自动生成回复、竞争分析、受众发现等功能，帮助用户发现潜在客户、提升品牌曝光、进行大规模冷外联等，同时提供数据驱动的报告和分析。定价灵活，适用于企业、代理机构、SaaS以及创作者。

News Minimalist是一个AI策展的新闻摘要服务，它从海量新闻中筛选出线%的故事。这个服务提供了一个没有垃圾新闻、点击诱饵或广告的纯净新闻阅读体验，用户都能够通过每日通讯获得新闻摘要。

Creately VIZ是一款AI视觉智能工具，能够快速生成可视化内容，自动化任务，并帮助用户发现新的视角。它提供多种功能，包括AI模板生成、自动化工作流程、与团队协作等。适用于各种场景，如白板协作、业务流程管理、战略规划等。产品定位于提高团队工作效率，提供创新视角。

GeminiProChat是GeminiPro的最小化Web界面，提供简洁有效的聊天体验。它支持通过环境变量来控制网站，允许使用者通过Docker部署，并提供易于部署的Vercel和Railway选项。GeminiProChat是一个灵活的工具，适用于需要简单、高效聊天界面的用户。

AppAgent是一个基于LLM（大型语言模型）的多模态代理框架，设计用于操作智能手机应用。通过简化的动作空间（如点击和滑动），模仿人类般的互动方式，实现应用操作，无需系统后端访问。代理通过自主探索或观察人类演示学习新应用的使用方法，创建知识库用于执行不同应用中的复杂任务。

Reply Boy是一款Chrome浏览器插件，旨在帮助您增加Twitter账号的曝光。您可以选择不同类型的回复（问题、肯定），并选择不同的情绪（浪漫、有趣、聪明等），从而轻松产生优质的推文。Reply Boy注重安全和隐私，不追踪用户数据，不记录消息，遵守Twitter规则，无需您的密码。您可以免费尝试，无需任何设置。

DeepSwapper是一款免费高质量的换脸服务。用户能够最终靠上传图片进行换脸操作，DeepSwapper提供无水印、无广告、高质量、无限次数的换脸服务。DeepSwapper使用AI技术实现真实的脸部交换效果。DeepSwapper支持多种图片格式上传，同时也提供API服务。

Animos是一款面向儿童的对话玩具，也是家长的辅助工具。它通过AI技术回答孩子的各种问题，提供逻辑思维游戏，引入早期双语环境，并帮助孩子理解和处理情感。Animos旨在将屏幕时间转化为互动学习冒险，提高儿童的语言发展，识别孩子的兴趣并激发好奇心。此外，Animos注重隐私保护和内容安全，为家长提供日常总结和反馈功能。

使用Resume，在短短 5 分钟内创建一份能帮助你获得工作的简历。选择超过 20 个专业、现代和创意的简历模板。

Slay School是一款AI闪卡制作器，能够帮助学生将笔记转化为简洁易记的闪卡，节省时间并专注于学习。用户都能够上传讲座资料、粘贴笔记或提交链接，Slay School能在几秒钟内自动生成闪卡。支持自测或导出至Anki/Quizlet。产品定位于学生群体，很适合医学生。

Steerable Motion是一个用于批量创意插值的ComfyUI节点。我们的目标是展示在图像作为视频模型演变时，如何以最佳方式驱动运动。

EasyTranslator是一个基于OpenAI API的命令行工具，支持多种文件格式（包括.txt、.pdf、.docx、.md、.mobi和.epub）的翻译。它能轻松地翻译文本文件，消除语言障碍。

Google Gemini是由DeepMind开发的多模态AI模型，能处理文本、音频、图像等多种信息。它包括三个版本：Ultra、Pro和Nano，分别针对不一样的任务复杂度。Gemini在AI基准测试中表现出色，针对各种设备做了优化，并已经过安全和偏见测试，遵循负责任的AI实践。它将集成到Google产品中，并通过Google AI Studio和Google Cloud Vertex AI提供。

上一篇： QC小组破解管道施工难题

下一篇： 2024国考行测有多少道题_公务员国考行测题型数量