如何用ChatGLM生成技术专利的申请文本?
在技术专利申请过程中,AI工具可作为辅助手段提升文本生成效率,但需严格遵循法律规范与技术标准,以下结合ChatGLM的部署与专利文本生成逻辑,提供可落地的操作指南。
环境部署与模型调用
-
硬件配置要求
需配备至少16GB显存的GPU(如NVIDIA RTX 3090),或使用支持量化模型的CPU环境,显存不足时可采用INT4/INT8量化版本,降低推理资源占用。 -
模型部署步骤
- 下载代码:通过GitHub克隆ChatGLM项目,或使用ModelScope平台下载模型文件。
- 环境配置:安装Python 3.10、Miniconda及依赖库(如transformers 4.27.1、torch 2.0+)。
- 模型加载:修改
web_demo.py中的路径参数,指定本地模型文件位置。 - 服务启动:运行
python web_demo.py,通过浏览器访问http://127.0.0.1:7860进行交互。
-
API调用示例
使用Python的requests库调用ChatGLM接口,示例代码如下:
import requests def generate_patent_text(prompt): url = "http://localhost:7860/v1/chat/completions" headers = {"Content-Type": "application/json"} data = { "model": "chatglm3-6b", "messages": [{"role": "user", "content": prompt}], "max_tokens": 1024 } response = requests.post(url, json=data, headers=headers) return response.json()["choices"][0]["message"]["content"]
专利文本生成流程
-
技术资料准备
需整理以下核心内容:- 发明背景:明确技术领域、现有技术缺陷(如爬虫效率低、准确性差)。
- 技术方案:分解为模块化步骤(如GPT模型训练、字段抽取规则)。
- 实施例:提供具体参数(如模型层数、学习率)、硬件配置(如服务器型号)。
- 附图说明:标注流程图、结构图编号及对应技术特征。
-
Prompt设计策略
采用分阶段提问法,示例如下:- 阶段1:提取格式与流程
“以资深专利代理人身份,分析以下专利范文的结构,提取权利要求书、说明书、附图说明的撰写规范。” - 阶段2:生成技术方案
“根据以下技术特征生成专利文本:发明名称‘基于GPT的通用数据抽取方法’,技术问题‘提升爬虫效率与准确性’,技术方案包括GPT模型微调、字段映射规则。” - 阶段3:优化权利要求
“针对以下技术方案,生成独立权利要求与从属权利要求,确保保护范围覆盖模型训练方法、字段抽取逻辑及硬件部署方案。”
- 阶段1:提取格式与流程
-
文本校验与修正
- 术语一致性:统一专业名词(如“GPT”避免与“NLP”混淆)。
- 表达精准度:避免模糊表述(如“优化效率”改为“将文本抽取速度提升30%”)。
- 格式合规性:参照《专利审查指南》调整章节布局,权利要求书需分条编号。
关键注意事项
-
法律风险规避
- 禁止生成涉及商业秘密、未公开技术的内容。
- 权利要求书需基于充分实验数据,避免“功能性限定”表述(如“实现高效抽取”)。
-
人工审核必要性
- 审查技术方案的创新性,确保与现有专利(如CN202310123456.7)存在实质差异。
- 验证实施例的可复现性,需包含具体代码片段或硬件参数。
-
效率优化技巧
- 采用“分块生成-合并校验”法,先生成权利要求书框架,再补充说明书细节。
- 利用ChatGLM的上下文记忆能力,在多轮对话中逐步完善文本。
案例验证
以“基于GPT的网页文本抽取方法”为例,通过以下Prompt生成文本:
“生成专利文本,包含以下要素:发明名称‘一种基于GPT的网页文本抽取方法’,技术问题‘现有爬虫无法准确提取结构化数据’,技术方案包括GPT模型微调、字段映射规则、多线程处理机制,关键保护点为模型训练方法与字段抽取逻辑。”
生成结果需人工修正以下问题:
- 补充实验数据(如“在10万网页数据集上准确率达95%”)。
- 细化实施例(如“使用PyTorch框架,学习率设为0.001”)。
- 调整权利要求书(将“多线程处理”拆分为从属权利要求)。
通过上述流程,可显著提升专利文本的生成效率,但需始终以人工审核为核心,确保技术方案的合法性与创新性。
-
喜欢(11)
-
不喜欢(2)

