USPTO 下载工具安装指南¶
本教程将指导您设置并运行基于MCP(模型上下文协议)服务器的USPTO专利文档下载工具。该工具需要GPU以对专利PDF进行光学字符识别,并提取专利文本。
概述¶
该目录包含以下 MCP 服务器实现:
uspto_downloader_MCP.py:实现从USPTO下载和处理专利文档功能
先决条件¶
硬件要求¶
GPU:推荐使用 NVIDIA A100 或 H100 GPU
系统要求¶
基于Linux的系统(已在Ubuntu/CentOS上测试)
支持CUDA的GPU驱动程序
API 调用的网络访问
设置说明¶
1. Environment Setup¶
conda create -n tooluniverse-env python=3.11 -c conda-forge -y
conda activate tooluniverse-env
# Verify CUDA support
python -c "import torch; print(f'CUDA available: {torch.cuda.is_available()}')"
2. Install ToolUniverse and MCP Dependencies¶
# Install compatible NumPy version first
pip install "numpy==2.0"
# Install ToolUniverse
git clone https://github.com/mims-harvard/ToolUniverse.git
cd ToolUniverse
python -m pip install . --no-cache-dir
# Install additional dependencies
pip install requests pymupdf easyocr python-docx Pillow pyarrow fastparquet lxml aiohttp
pip install -U sentence-transformers
4. Environment Configuration¶
设置环境变量¶
在调用 ToolUniverse 的 MCP 工具的客户端机器上设置所需的环境变量(而不是在运行该工具的 GPU 服务器上):
# For USPTO server (running on port 7000)
export USPTO_MCP_SERVER_HOST="your-gpu-hostname"
# USPTO API key
export USPTO_API_KEY="your-uspto-api-key"
重要提示:即使 MCP 服务器运行在不同的 GPU 机器上,也请在执行 ToolUniverse 代码的机器上设置这些变量。
查找您的GPU主机名:
# Get current hostname by running this command on the GPU where your MCP server will run.
hostname
# Example hostnames:
# - gpu-node-01
# - compute-a100-001.cluster.edu
# - localhost (if running locally)
运行 MCP 服务器¶
1. Start USPTO MCP Server¶
### 1. Start USPTO MCP Server on the GPU where you want it to run.
python uspto_downloader_mcp_server.py
服务器将启动于 http://0.0.0.0:7000,但可通过您的 GPU 主机名访问(例如,http://your-gpu-hostname:7000)以检索专利文档。
使用示例¶
如需全面的使用示例和测试模式,请参阅测试文件:
# View MCP tool usage examples
cat ToolUniverse/src/tooluniverse/test/test_mcp_tool.py
此测试文件包含与USPTO专利下载器MCP服务器交互的详细示例,包括正确的API调用和参数格式化。