释放双眼，带上耳机，听听看~！

本文介绍了大模型时代的到来，讨论了AI算法研究的门槛与工程开发的春天，以及使用huggingface开源的翻译大模型搭建和部署翻译APP的实现过程。

好记性不如烂笔头，不如趁热记录下，给未来的自己

前言

大模型时代的到来，隐隐约约感觉到：大模型的出现，提高了AI算法研究的门槛，却降低了工程开发应用AI的难度。传统工程技术开发者的春天来了。

大模型社区，百花齐放，争相变着法地降低大模型的应用难度，恨不能只要一句代码，就能跑一个大模型的推理服务。
最为代表性的 AI 社区是 huggingface (应该没有之一？)，俨然已经成为全球开源大模型的“集散地”：
大模型时代的到来：AI算法研究的门槛与工程开发的春天

上面有很多好玩、实用、“~~国外一开源，国内遥遥领先~~” 的大模型，都可以拿回来做一些有意思的事情。

今天，我们使用 HF 上由 facebook 开源的翻译大模型，来搭建和部署一个简单的翻译APP。（基于 openxlab-apps 和 gradio）

实现

模型获取

方式1 – 直接从 HF 上 git clone

git clone https://huggingface.co/facebook/m2m100_1.2B

注意：

需要先安装git lfs，安装参考点我。
国内访问 HF 和下载模型比较慢/不稳定

方式2 – 从 OpenXLab-Models 下载

OpenXLab-Models 是国内的大模型HUB平台，用户可以自己上传/下载模型，因为部署在国内，所以下载会很稳定，速度也很快。

下载方式有两种，一种直接通过url在浏览器或者wget等方式下载；另一种方式使用 openxlab 提供的 python sdk （安装 pip install openxlab）在代码里在线下载模型（这将会是本文将要使用的方式）

大模型时代的到来：AI算法研究的门槛与工程开发的春天

模型推理

直接使用 HF 的 transformers 包，即可完成模型装载和推理：

from transformers import M2M100ForConditionalGeneration, M2M100Tokenizer

hi_text = "जीवन एक चॉकलेट बॉक्स की तरह है।"
chinese_text = "生活就像一盒巧克力。"

model = M2M100ForConditionalGeneration.from_pretrained("facebook/m2m100_1.2B")
tokenizer = M2M100Tokenizer.from_pretrained("facebook/m2m100_1.2B")

# translate Hindi to French
tokenizer.src_lang = "hi"
encoded_hi = tokenizer(hi_text, return_tensors="pt")
generated_tokens = model.generate(**encoded_hi, forced_bos_token_id=tokenizer.get_lang_id("fr"))
tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
# => "La vie est comme une boîte de chocolat."

# translate Chinese to English
tokenizer.src_lang = "zh"
encoded_zh = tokenizer(chinese_text, return_tensors="pt")
generated_tokens = model.generate(**encoded_zh, forced_bos_token_id=tokenizer.get_lang_id("en"))
tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
# => "Life is like a box of chocolate."

封装到 gradio APP

源码已开源。

import torch
import gradio as gr
from transformers import M2M100Tokenizer, M2M100ForConditionalGeneration
from openxlab.model import download
import os

class Language:
    def __init__(self, name, code):
        self.name = name
        self.code = code

lang_id = [
    Language("Afrikaans", "af"),
    Language("Shqip", "sq"),  # Albanian
    Language("አማርኛ", "am"),  # Amharic
    Language("العربية", "ar"),  # Arabic
    # 列表太长，缩略... 源码： https://github.com/fly2tomato/Translate-100_link
]
d_lang = lang_id[21]
#d_lang_code = d_lang.code

def trans_page(input,trg):
    src_lang = d_lang.code
    for lang in lang_id:
            if lang.name == trg:
                trg_lang = lang.code
    if trg_lang != src_lang:
        tokenizer.src_lang = src_lang
        with torch.no_grad():
            encoded_input = tokenizer(input, return_tensors="pt").to(device)
            generated_tokens = model.generate(**encoded_input, forced_bos_token_id=tokenizer.get_lang_id(trg_lang))
            translated_text = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
    else:
        translated_text=input
        pass
    """    
    if trg_lang != src_lang:
        
        tokenizer.src_lang = src_lang
        with torch.no_grad():
            #lang_tr = lang_id
            encoded_input = tokenizer(lang_id, return_tensors="pt").to(device)
            generated_tokens = model.generate(**encoded_input, forced_bos_token_id=tokenizer.get_lang_id(trg_lang))
            translated_text1 = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
    else:
        translated_text1=input1
        pass
    #return translated_text,gr.Dropdown.update(choices=list(translated_text1.keys()))
    """
    return translated_text

def trans_to(input,src,trg):
    print(f"input={input}, src={src}, target={trg}")
    if not input:
        return ""
    for lang in lang_id:
        if lang.name == trg:
            trg_lang = lang.code
    for lang in lang_id:
        if lang.name == src:
            src_lang = lang.code
    if trg_lang != src_lang:
        tokenizer.src_lang = src_lang
        with torch.no_grad():
            encoded_input = tokenizer(input, return_tensors="pt").to(device)
            # print(f"encoded_input = {encoded_input}")
            generated_tokens = model.generate(**encoded_input, forced_bos_token_id=tokenizer.get_lang_id(trg_lang), max_length=1024000)
            # print(f"generated_tokens = {generated_tokens}")
            translated_text = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
            # print(f"translated_text = {translated_text}")
    else:
        translated_text=input
        pass
    return translated_text


def download_models(models_path: str):
    # download models from openxlab-models by openxlab sdk
    print("start to download models from xlab-models")
    download(model_repo='xj/facebook_m2m100_1.2billion', output=models_path)
    print("end to download models from xlab-models")

# 支持 GPU 和 CPU 双算力推理
if torch.cuda.is_available():
    device = torch.device("cuda:0")
else:
    device = torch.device("cpu")
# 下载模型（如果存在，则跳过）
pwd = os.getcwd()
models_path = pwd+"/model/12b"
download_models(models_path)
# 推理Pipeline
tokenizer = M2M100Tokenizer.from_pretrained(models_path)
model = M2M100ForConditionalGeneration.from_pretrained(models_path).to(device)
model.eval()


with gr.Blocks(title="百语翻译-应用中心-OpenXLab", theme="soft") as transbot:
    md = gr.HTML("""<h1><center>百语翻译</center></h1><h4><center>基于Facebook开源模型: <a href="https://openxlab.org.cn/models/detail/xj/facebook_100-Translate_1.2billion">m2m100_1.2B</a></center></h4>""")
    with gr.Row():
        with gr.Column():
            lang_from = gr.Dropdown(show_label=False, choices=[l.name for l in lang_id],value="English")
            message = gr.Textbox(label="原文", placeholder="请输入原文", lines=4)
        with gr.Column():
            lang_to = gr.Dropdown(show_label=False, choices=[l.name for l in lang_id],value="中文")
            translated = gr.Textbox(label="翻译", lines=4, interactive=False)
    with gr.Column():
        submit = gr.Button(value="翻译", variant="primary")
    submit.click(trans_to, inputs=[message,lang_from,lang_to], outputs=[translated])

def launch_app():
    transbot.launch(server_name="0.0.0.0", server_port=7860)

if __name__ == "__main__":
    launch_app()

大概就长这样：

大模型时代的到来：AI算法研究的门槛与工程开发的春天

以上。

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

大模型时代的到来：AI算法研究的门槛与工程开发的春天

前言

实现

模型获取

方式1 – 直接从 HF 上 git clone

方式2 – 从 OpenXLab-Models 下载

模型推理

封装到 gradio APP

电脑清理大法：断舍离让C盘快速腾出十几个G的空间

亚马逊简单存储服务（Amazon S3）高可用性架构探究

GeoSpy.ai

即梦Dreamina

Globe Explorer

Luma Dream Machine

抖音即创

Motionshop

归档

{{userData.name}}已认证

前言

实现

模型获取

方式1 – 直接从 HF 上 git clone

方式2 – 从 OpenXLab-Models 下载

模型推理

封装到 gradio APP

电脑清理大法：断舍离让C盘快速腾出十几个G的空间

亚马逊简单存储服务（Amazon S3）高可用性架构探究

讯飞星火大模型，全场景开放，助力程序员提升工作效率

老黄现场演示与游戏NPC聊天！大模型开口建议玩家去找犯罪头目，网友：西部世界成真

国产大模型天工推理能力超GPT-3.5，冲进OpenAI评测榜第一梯队

文心千帆：PPT 制作、数字人主播一键开播等数十种应用场景惊艳到我了