首页 > Python资料 博客日记
昇腾环境下使用docker部署mindie-service
2024-10-08 03:00:07Python资料围观92次
本篇文章分享昇腾环境下使用docker部署mindie-service,对你有帮助的话记得收藏一下,看Python资料网收获更多编程知识
MindIE是基于昇腾硬件的运行加速、调试调优、快速迁移部署的高性能深度学习推理框架。它包含了MindIE-Service、MindIE-Torch和MindIE-RT等组件。我主要用MindIE-Service的功能,这个组件对标的是vllm这样的大语言推理框架。
启动docker容器
先拉取镜像(要去官网获取最新镜像版本)
docker pull swr.cn-central-221.ovaijisuan.com/dxy/mindie:1.0.RC1-800I-A2-aarch64
然后启动容器,我这里将前2张NPU加速卡映射到docker内:
docker run --name my_mindie -it -d --net=host --shm-size=500g \
--device=/dev/davinci0 \
--device=/dev/davinci1 \
-w /home \
--device=/dev/davinci_manager \
--device=/dev/hisi_hdc \
--device=/dev/devmm_svm \
--entrypoint=bash \
-v /usr/local/Ascend/driver:/usr/local/Ascend/driver \
-v /usr/local/dcmi:/usr/local/dcmi \
-v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \
-v /usr/local/sbin:/usr/local/sbin \
-v /root/xxx/mindformer_share/:/home/xxx_share \
-v /tmp:/tmp \
-v /etc/hccn.conf:/etc/hccn.conf \
-v /usr/share/zoneinfo/Asia/Shanghai:/etc/localtime \
-e http_proxy=$http_proxy \
-e https_proxy=$https_proxy \
swr.cn-central-221.ovaijisuan.com/dxy/mindie:1.0.RC1-800I-A2-aarch64
上面-v /root/xxx/mindformer_share/:/home/xxx_share是在映射我的磁盘进容器,需要根据自己的环境做修改。
进入容器:
docker exec -it my_mindie bash
进入之后执行环境设置:
source /usr/local/Ascend/ascend-toolkit/set_env.sh
source /usr/local/Ascend/mindie/set_env.sh
修改服务配置
上述操作做完,就可以修改mindie-service的配置文件了,这个文件位于/usr/local/Ascend/mindie/latest/mindie-service/conf/config.json。
"ipAddress" : "0.0.0.0",
"port" : 1025,
"ModelDeployParam":
{
"maxSeqLen" : 4096,
"npuDeviceIds" : [[0,1]],
"ModelParam" : [
{
"modelName" : "baichuan2",
"modelWeightPath" : "/home/xxxx/baichuan-inc/Baichuan2-13B-Chat/",
"worldSize" : 2,
"cpuMemSize" : 5,
"npuMemSize" : 10,
"backendType": "atb"
}
]
},
我这里罗列下我关注的字段。
- ipAddress和port是监听网络和地址
- modelName是tritton-url请求里要用的字段,需要记下来
- npuDeviceIds指定用哪几张卡
- worldSize是使用npu的数量,必须与npuDeviceIds中的卡数一致
- modelWeightPath模型路径
- maxSeqLen最大长度
启动服务
cd /usr/local/Ascend/mindie/latest/mindie-service/
bin/mindieservice_daemon
如何使用服务
可以用postman或者python接口调用http服务。
POST http://223.106.234.6:2250/generate
{
"prompt": "你是谁?\n",
"max_tokens": 1024,
"repetition_penalty": 1.03,
"presence_penalty": 1.2,
"frequency_penalty": 1.2,
"temperature": 0.5,
"top_k": 10,
"top_p": 0.95,
"stream": false
}
mindie支持openai\triton\vllm等接口。具体可参考文档 这里
参考资料
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
标签:
相关文章
最新发布
- 光流法结合深度学习神经网络的原理及应用(完整代码都有Python opencv)
- Python 图像处理进阶:特征提取与图像分类
- 大数据可视化分析-基于python的电影数据分析及可视化系统_9532dr50
- 【Python】入门(运算、输出、数据类型)
- 【Python】第一弹---解锁编程新世界:深入理解计算机基础与Python入门指南
- 华为OD机试E卷 --第k个排列 --24年OD统一考试(Java & JS & Python & C & C++)
- Python已安装包在import时报错未找到的解决方法
- 【Python】自动化神器PyAutoGUI —告别手动操作,一键模拟鼠标键盘,玩转微信及各种软件自动化
- Pycharm连接SQL Sever(详细教程)
- Python编程练习题及解析(49题)
点击排行
- 版本匹配指南:Numpy版本和Python版本的对应关系
- 版本匹配指南:PyTorch版本、torchvision 版本和Python版本的对应关系
- Python 可视化 web 神器:streamlit、Gradio、dash、nicegui;低代码 Python Web 框架:PyWebIO
- 相关性分析——Pearson相关系数+热力图(附data和Python完整代码)
- Anaconda版本和Python版本对应关系(持续更新...)
- Python与PyTorch的版本对应
- Windows上安装 Python 环境并配置环境变量 (超详细教程)
- Python pyinstaller打包exe最完整教程