首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏IT杂谈学习

    丹摩:UNet模型的训练与测试指南

    本文将介绍如何在丹摩平台上进行UNet模型的训练与测试,以眼底血管分割为例,详细说明配置选型、数据准备、网络搭建、训练和测试的全过程。 二、云实例配置与启动 2.1 登录注册 首先,需要在丹摩平台进行登录或注册,创建账号后登录。 2.2 配置SSH密钥对 SSH密钥对的配置可以避免后续远程登录服务器时的密码验证,提高便利性。 三、云存储:数据集上传与下载 丹摩提供的文件存储是网络共享存储,可以在不同实例间共享数据集,提高数据的可靠性。使用scp工具将训练数据上传到云实例数据盘中。 五、总结 丹摩平台提供了强大的GPU资源和便捷的操作界面,使得UNet模型的训练和测试变得简单快捷。无论是医学图像分割还是其他领域的应用,丹摩都能满足您的需求,推动您的项目向前发展。 随着技术的不断进步,我们有理由相信,丹摩将继续在人工智能领域发挥重要作用。

    84910编辑于 2024-09-25
  • 腾讯云底座构建存网数一体架构,突破大模型力瓶颈

    打造存网数一体的高性能软硬协同方案 为破解上述产业困境,腾讯云推出存网数一体的云原生解决方案,通过“一云多芯、软硬协同”的模式,提供涵盖公有云、专有云(CDZ/CDC/TCE/TCS)在内的多形态灵活部署底座 赋能头部大模型企业实现亿级降本与极致维保 在实际客户应用中,该底座有效解决了从基础设施投资到模型合规备案的端到端业务痛点: 元象 XVERSE(大模型厂商): 借助腾讯云提供的GPU高性能计算集群 谱AI(AI大模型独角兽): 在腾讯云底座支持下,模型训练集群效率大幅跃升,提升幅度达3.23倍。 实现极高的运维保障标准,GPU服务器故障可在5分钟内自动恢复。 依托高并发与全生态兼容确立大模型厂商首选地位 腾讯云解决方案凭借其硬核的技术指标与广泛的市场覆盖,确立了其在AI基础设施赛道的竞争壁垒: 极致的千卡集群性能: 方案千卡并行加速比高达96%,性能指标优于友商 目前,90%的国内头部大模型厂商(如美团、快手、知乎、小红书、蔚来等)首选该底座。 (数据来源:腾讯云解决方案官方发布材料)

    29310编辑于 2026-05-30
  • 来自专栏智能人工

    计算正向跨越

    “这些数据表明,随着高质量力基础设施建设的推进,以及云计算、大数据、人工智能、区块链等技术和应用的落地普及,我国力技术创新不断提速,力产业保持高速增长,力规模持续快速提升,力产业生态日渐完善。 “计算力不仅是生产力,还是创造力,计算正向跨越。” 浪潮信息总裁彭震认为,计算力和算法是中心的核心,要想产生一流的智慧,就必须要有一流的算法,同时算法的高效运转要依赖领先的计算力,计算力基建化和算法基建化相辅相成。  力总规模超过140每秒浮点运算次数,近5年年均增速超过30%,力规模排名全球第二。全国在用超大型、大型数据中心超过450个,中心超过20个。 “我国力产业发展呈现三大趋势,即力形式更加多样,力资源泛在分布;基础设施建设加速,网融合持续深入;创新应用竞相涌现,产业生态日渐完善。”谢存说。 

    65020编辑于 2022-08-15
  • 来自专栏智算中心网络

    解密 AI 大模型训练背后的 RoCE 网络架构

    模型时代:为什么GPU训练离不开高效的AI网络?从“连接服务器”到“决定力效率”的角色转变在大模型时代,AI网络(AI Computing Network)的角色发生了颠覆性的变化。 这是一个典型的“木桶模型”:只要有一条链路变慢或一个GPU延迟,整个集群都必须停下来等待。因此,AI网络面临着三大核心挑战:高带宽:随着万卡、十万卡集群的普及,网络需要承载海量数据吞吐。 解构中心:解密四大网络平面与流量模型四大网络平面的协同与隔离为了避免不同类型的业务流量相互干扰,一个标准的AI算数据中心通常会划分为四个独立的网络平面:网络平面核心职责特性要求计算网负责GPU之间高性能的同步通信 在这种流量模型下,传统网络常用的五元组哈希(Hash)和ECMP(等价多路径路由)极易导致链路负载不均和哈希极化。因此,网络采用1:1的无收敛设计。 构建面向未来的AI力底座在大模型技术快速发展的当下,AI网络已成为释放GPU力的关键。

    35000编辑于 2026-06-09
  • 来自专栏星融元

    深度剖析:力网络及网融合

    前文介绍了与云网融合的关系,那么力网络、网融合的关系又是什么?让我们先来复习一下的概念。 AI的概念即人工智能计算,主要面向人工智能应用,提供人工智能算法模型训练与模型运行服务的计算机系统能力,代表了人工智能领域的飞速发展。它主要用于处理复杂、高维、动态、非结构化的数据和问题。 三者的关系是什么通过上文对概念的描述,我们可以将翻译为“数据+力+算法”,如图4所示。涉及丰富的计算场景,需要用到大模型计算,处理海量数据。基于的这种特性,力需求激增。 力网络和网融合为提供了强大的技术支撑,而的发展推动了网融合和力网络的进步,他们三者是相互促进的关系。时代如何打造力网络在时代下,如何打造力网络,做到网融合呢? 这个过程就是一次调度工作,可用于大模型力调度。除此之外,Kubernetes 有业务负载检查的能力,可以实现资源合理分配、高效利用。

    2.5K11编辑于 2024-08-30
  • 来自专栏IT杂谈学习

    丹摩:Kolors模型的部署与使用指南

    丹摩平台最近引入了Kolors模型,这是一个由快手Kolors团队开发的基于潜在扩散的大规模文本到图像生成模型。 本文将详细介绍Kolors模型的特点、部署步骤以及如何在丹摩平台上使用它来生成高质量的图像。 三、DAMODEL平台创建适配机器 在丹摩平台上,您可以根据Kolors模型的要求选择合适的机器配置。本示例中使用4090 GPU容器。 其他配置按上述前置条件来。 五、总结 Kolors模型的引入,使得丹摩平台在文生图领域更进一步。无论是艺术家、设计师还是普通用户,都可以利用Kolors模型轻松创造出令人惊叹的图像。 随着技术的不断进步,我们有理由相信,丹摩将继续在人工智能领域发挥重要作用。

    64510编辑于 2024-09-25
  • 来自专栏腾讯专有云

    腾讯专有云套件,助力普惠大模型落地

    2025年5月24日,以“面向十五五 数领航新机遇”为主题的2025央国企及上市公司数创新峰会,在北京圆满闭幕。 在这一技术演进过程中,腾讯专有云TCE针对大模型力、存储、网络的严苛要求,推出专有云套件,通过高性能计算集群HCC、智能高性能网络IHN、高性能文件存储TurboFS三大核心组件,为企业提供了从模型训练到推理部署的全链路优化 高性能计算集群HCC(CVM/CBM) 提供训练、推理多元力,包括单机单卡、单机多卡、多机多卡,并可通过qGPU等技术为算算力进行精准划分和调度。 尚航科技SunClouds采用TCE作为力云平台的核心基座,承载多种异构计算、通用计算、分布式存储、云原生及安全服务,接入DeepSeek大模型,为尚航云终端用户提供一站式自助用云、弹性用云和敏捷部署大规模并行计算及联机大模型训练 未来,腾讯专有云TCE将继续深耕AI领域,不断优化腾讯专有云套件,通过提供高性能、高可用且具有高性价比的解决方案,满足企业日益增长的智能化需求,助力企业开拓更为广阔的发展空间,进而为数字经济的高质量发展贡献更多的力量

    89300编辑于 2025-06-09
  • 腾讯云全栈方案:破解大模型力瓶颈与量化业务指标

    突破万亿参数模型的“木桶效应”与力损耗 当前AI已进入万亿参数模型的高速发展期,企业在模型的训练、推理与应用三大场景中,正面临极高的资源错配风险与运维挑战: 集群力木桶效应: 大模型训练极度依赖计算 部署存网一体化异构基础架构 为消除单一维度的性能短板,腾讯云提供一云多芯、软硬协同的全栈解决方案,支持公有云、专有云(TCE)及本地化分布式部署: 高性能计算与异构力管理: 构建基于RDMA互联的高性能计算集群 驱动训练提速与运维成本降低的关键指标 通过存网数深度协同,腾讯云方案在投资回报率(ROI)、系统稳定性及开发效率上实现了以下核心业务指标的提升: 核心提效指标一:万亿大模型训练效率较上一代集群提升 头部大模型厂商的工程化落地验证 目前,腾讯云底座已服务超过10万家客户,成为90%国内头部大模型厂商的首选。 谱 AI(GLM-130B及产品矩阵构建): 业务痛点: 应对业务规模扩张带来的专属力空缺,及大规模集群下的快速故障恢复需求。

    24110编辑于 2026-05-30
  • 来自专栏IT创事记

    南京中心:力枢纽节点新标杆

    人工智能是新时代的宠儿,它是无限生产力的创造者,也是有限力的“吞金兽”。 有统计表明,AI模型训练所需的力平均100天就会翻番,这意味着对力的需求每隔5年要翻十万倍以上。 在释放力层面,基于主流人工智能理论算法,采用全流程软件工具,针对不同场景应用需求,通过机器学习自动化的方法,产出高质量的AI模型或服务,促进力高效转化为生产力。 生态强化聚集效应 力枢纽不仅是力上下腾挪的中转站,更是催生人工智能良性生态的孵化台。 依托南京中心,以“基础设施+框架+算法”为底层基础、以AI模型生成和多场景应用为特征的AI技术生态链正在逐渐形成。 其中,中科院计算所利用中心的力平台开展蛋白质结构预测的AI推断服务,唯仁科技、南栖仙策、南京图泰等企业在智慧医疗、智能车联网、智能制造、自动驾驶等领域进行AI模型的训练推理任务研究。

    1.9K30编辑于 2022-08-30
  • 腾讯云产品概要

    一、 产品定位与核心亮点 腾讯云算是一款面向AI应用与模型训练推理的高性能云计算服务。 其核心技术属性为AI原生基础设施,商业差异化卖点在于提供从底层硬件到上层应用的全栈式、高可靠、高效率的AI力解决方案。 二、 产品应用场景 AI应用开发者:在需要快速构建和部署交互式AI应用(如智能体、驾)时,面临服务不稳定、扩容速度慢等开发门槛高的问题。 解决方案:客户采用腾讯云的稳定可靠基础设施(自研AI服务器、模型分发引擎、全球应用加速)与智能高效的资源调度方案。 应用成效:实现了服务稳定性保障与业务扩展性支持。 总结 腾讯云通过整合稳定可靠的基础设施、智能高效的资源调度及丰富开放的配套工具,为AI应用与模型训练提供高性能、高可靠的力支持,其公有云与专有云采用同源同构的分布式架构,并在Gartner评估中表现突出

    17810编辑于 2026-05-30
  • 来自专栏IT杂谈学习

    丹摩:Faster R-CNN 模型训练与测试指南

    本文将介绍如何在丹摩平台上进行 Faster R-CNN 模型的训练与测试,包括环境配置、数据集准备、模型训练和测试验证。 2.2 创建云实例 在丹摩平台上创建 GPU 云实例,选择适当的 GPU 型号(如 NVIDIA GeForce RTX 4090),并下载私钥文件,用于后续的免密登录。 配置数据集路径和训练脚本,确保模型能够正确读取数据。 四、模型训练 4.1 训练命令 使用 mmdetection 工具进行模型训练。指定模型配置文件和权重文件,启动训练过程。 python . 五、总结 丹摩平台提供的 GPU 云实例能够满足深度学习训练的需求,使得 Faster R-CNN 模型的训练和测试变得简单快捷。 随着技术的不断进步,我们有理由相信,丹摩将继续在人工智能领域发挥重要作用。

    1.1K10编辑于 2024-09-25
  • 来自专栏腾讯专有云

    TCE云套件荣获高效能云创新先锋奖

    大会聚焦于崛起、赋能协同、力新十年等行业热点话题展开了深入探讨。 在大会AI力建设系列分论坛演讲环节,腾讯专有云TCE产品负责人丛磊发表了《新趋势下,打造自主可控的全栈云平台》主题演讲,重点阐述了腾讯专有云TCE在建设方面的产品布局及成果。 ,支撑企业搭建高性能云,解决客户本地化、数据安全、数据隐私等诉求。 无论您是想组建大型中心来承接公共力服务,还是希望通过行业云来赋能上下游行业,套件强大的行业云能力都能轻松实现。 从资源规划、容量模型,到备份容灾、安全管理等方面都配备完整的产品能力,确保基础设施的安全稳定高效运行。

    56610编辑于 2025-02-05
  • 来自专栏IT杂谈学习

    丹摩:探索Llama3.1模型的部署与使用

    最近,Meta推出的Llama3.1模型以其卓越的性能和开源特性,成为了NLP领域的一大热点。本文将带你深入了解Llama3.1模型,并探索如何在丹摩平台上部署和使用这一强大的工具。 在丹摩平台的控制台中,选择GPU云实例并点击创建实例。在实例配置中,根据需求选择付费类型,短期需求可以选择按量付费或包日,长期需求可以选择包月套餐。 接下来,下载并解压Llama3.1模型文件。丹摩平台提供了内网高速下载服务,可以快速下载预制的Llama-3.1-8B-Instruct模型。 三、使用教程 3.1 创建Chatbot 模型部署完成后,可以创建一个简单的Chatbot来测试模型的性能。 在终端中运行以下命令,启动streamlit服务: streamlit run llamaBot.py --server.address 0.0.0.0 --server.port 1024 通过丹摩平台提供的端口映射功能

    60310编辑于 2024-09-26
  • 来自专栏星融元

    AI中心,大模型训练背后的网络流量“奥秘”

    前言:自2017年起,AI模型的规模每半年翻一番,从初代Transformer的6500万增长到GPT-4的1.76万亿,预计下一代大语言模型将达到10万亿规模。 在大模型出现之前,整个过程在可在一台AI服务器内部完成,训练程序从服务器本地磁盘读取AI模型和训练集,加载到内存中,完成训练、评估,然后将结果存储回本地磁盘。 AI大模型训练的网络流量有哪些? 进入大模型时代,AI训练的流量路径和其网络需求发生了巨大变革。 并行训练:AI中心的主要流量来源 当前广泛应用于AI训练并行计算模式主要有以下三类: 并行计算模式 详情 数据并行 将不同的样本数据分配给不同的GPU,以加快训练速度;用在主机之间 张量并行 将模型的参数矩阵划分为子矩阵 AI训练对中心网络的要求 通过以上分析和计算,我们可以得出一个典型的AI中心对计算网的核心需求。 超高带宽:一个epoch就会产生85EB的数据量,相当于整个互联网2.5天的流量。

    1.9K10编辑于 2024-08-06
  • 腾讯云套件:企业本地化专属云解决方案概要

    一、产品定位与核心亮点 腾讯云套件是腾讯云推出的全栈存网一体解决方案,旨在帮助企业构建本地化云平台。 推理加速(TACO-LLM): 采用Training-Free预测采样技术,逼近GPU力上限。具备特色量化方案、prefill加速及70B+大模型极速优化方案。 高性能计算集群(HCC): 软硬件协同优化,使AI大模型训练性能提升30%以上。具备数据读取快、网络交换快、训练计算快的特点。 解决方案: 全栈套件(含HCC、IHN、TurboFS等)。 成效: 支撑腾讯内部超700个应用的稳定运行。 公有云百万客户验证 背景: 公有云场景下多样化的力需求与稳定性挑战。 解决方案: 同源同构的技术栈。 成效: 服务公有云百万客户,验证了方案的普适性与高可用性。 泛行业客户群体 自然语言处理领域: 支持泛互、出行、金融等行业的客户进行人机对话与文本分析训练。

    23110编辑于 2026-05-30
  • 腾讯云套件:企业本地化全栈解决方案概要

    一、 产品定位与核心亮点 腾讯云套件是腾讯云推出的存网一体解决方案,旨在帮助企业构建本地化专属云平台。 其核心技术属性在于通过软硬件协同优化,整合自研加速框架、高性能计算集群、网络、存储及云原生调度,提供高性能、高可用、高性价比的完整生态。 自然语言处理客户:涵盖泛互、出行、金融等行业,在人机对话、智能客服、文本分析等场景下,需要处理海量非结构化数据并进行模型训练。 训练性能:高性能计算集群HCC可使AI大模型训练性能提升30%以上(来源:方案优势-高性能计算集群HCC CVM CBM)。 高性能存储TurboFS:支持千卡并发读写,为高性能大模型提供存储底座。

    18710编辑于 2026-05-30
  • 来自专栏IT杂谈学习

    丹摩:掌握YOLOv8模型的训练与测试

    本文将介绍如何在丹摩平台上进行YOLOv8模型的训练与测试,包括数据集的准备、模型训练、以及测试验证。 yolov8l.yaml") results = model.train(data="VOC.yaml", epochs=100, device='0', batch=16, workers=0) 三、基于丹摩的训练 3.1 创建实例 在丹摩平台上创建GPU云实例,选择适合的GPU型号和镜像。 五、总结 丹摩平台提供的GPU云实例能够满足深度学习训练的需求,使得YOLOv8模型的训练和测试变得简单快捷。无论是学术研究还是商业应用,YOLOv8都将为您的项目带来强大的目标检测能力。 随着技术的不断进步,我们有理由相信,丹摩将继续在人工智能领域发挥重要作用。

    2.4K10编辑于 2024-09-26
  • 开源 | 数 平 台 (SSD-PAI)

    平 台 (SSD-PAI) [ Github 主仓库(优先更新)https://github.com/roinli/SSD-GPU-POOL ](https://github.com/roinli 、易用、全面的力资源管理与调度策略,解决传统力使用场景中力资源碎片化、用户需求多样化、运维管理工作量大等问题。 · 支撑研发过程形成闭环:数据准备 → 运行环境 → 模型训练 → 成果归档 → 成果复用。 支持数据共享 · 可公开各类科研成果,包括模型、项目、数据集及软件环境(镜像)等。 · 支持对各类公开科研成果进行复用,加速成果转化及科研合作。 数据 支持多源数据集管理 支持数据在线预览 支持数据在线标注 算法 丰富的平台预设算法 支持代码片段管理 模型训练辅助工具 模型 丰富的平台预设模型 支持用户模型入库管理 支持模型文件预览 力资源 基于容器云架构的调度

    12910编辑于 2026-06-17
  • 来自专栏IT杂谈学习

    丹摩:探索CogVideoX-6B模型的部署与使用

    丹摩(DAMODEL)作为这一领域的先行者,最近发布了其最新的视频生成模型——CogVideoX-6B。本文将带你深入了解CogVideoX-6B模型的部署与使用,让你领略丹摩的强大之处。 一、CogVideoX-6B:谱清影的突破 谱 AI 在 8 月 6 日宣布了一个令人兴奋的消息:他们将开源视频生成模型 CogVideoX,目前,其提示词上限为 226 个 token,视频长度为 端到端的视频理解模型:能够为视频数据生成精确且与内容紧密相关的描述。 cd CogVideo-main/ pip install -r requirements.txt 2.3 模型与配置文件 除了配置代码文件和项目依赖,还需要上传 CogVideoX 模型文件和对应的配置文件 下载模型:平台已为您预置了 CogVideoX 模型,您可内网高速下载,执行以下命令: cd /root/workspace wget http://file.s3/damodel-openfile/CogVideoX

    64510编辑于 2024-09-26
  • 驱代码:飞 JavaAI 探秘

    前言 本博客将深度记录我使用飞 JavaAI 插件从注册、功能测试到实战开发的全过程。通过大量截图、生成代码片段与实战效果演示,我将与你分享 AI 驱动下的 Java 开发革新时代。 飞介绍 飞JAVA AI 开发助手是飞算数科技(深圳)有限公司自主研发的智能开发工具,它将人工智能与 Java 技术相结合,旨在助力企业实现科技化、数字化、智能化转型升级。 支持文本 / 语音输入描述需求,利用大模型技术进行语义理解,能准确洞察业务需求。 对应位置也能点击飞小图标也能生成对应的代码注释。 因为对应的部分配置没有完成,小编就不展示了。 功能全面测评 1. 无论你是刚入门的新手还是需要事半功倍的资深开发者,飞 JavaAI 都值得一试。

    52410编辑于 2025-12-21
领券