USPTO 下载工具安装指南

本教程将指导您设置并运行基于MCP(模型上下文协议)服务器的USPTO专利文档下载工具。该工具需要GPU以对专利PDF进行光学字符识别,并提取专利文本。

概述

该目录包含以下 MCP 服务器实现:

  • uspto_downloader_MCP.py:实现从USPTO下载和处理专利文档功能

先决条件

硬件要求

  • GPU:推荐使用 NVIDIA A100 或 H100 GPU

系统要求

  • 基于Linux的系统(已在Ubuntu/CentOS上测试)

  • 支持CUDA的GPU驱动程序

  • API 调用的网络访问

设置说明

1. Environment Setup

conda create -n tooluniverse-env python=3.11 -c conda-forge -y
conda activate tooluniverse-env

# Verify CUDA support
python -c "import torch; print(f'CUDA available: {torch.cuda.is_available()}')"

2. Install ToolUniverse and MCP Dependencies

# Install compatible NumPy version first
pip install "numpy==2.0"

# Install ToolUniverse
git clone https://github.com/mims-harvard/ToolUniverse.git
cd ToolUniverse

python -m pip install . --no-cache-dir

# Install additional dependencies
pip install requests pymupdf easyocr python-docx Pillow pyarrow fastparquet lxml aiohttp
pip install -U sentence-transformers

4. Environment Configuration

设置环境变量

在调用 ToolUniverse 的 MCP 工具的客户端机器上设置所需的环境变量(而不是在运行该工具的 GPU 服务器上):

# For USPTO server (running on port 7000)
export USPTO_MCP_SERVER_HOST="your-gpu-hostname"

# USPTO API key
export USPTO_API_KEY="your-uspto-api-key"

重要提示:即使 MCP 服务器运行在不同的 GPU 机器上,也请在执行 ToolUniverse 代码的机器上设置这些变量。

查找您的GPU主机名:

# Get current hostname by running this command on the GPU where your MCP server will run.
hostname

# Example hostnames:
# - gpu-node-01
# - compute-a100-001.cluster.edu
# - localhost (if running locally)

运行 MCP 服务器

1. Start USPTO MCP Server

### 1. Start USPTO MCP Server on the GPU where you want it to run.
python uspto_downloader_mcp_server.py

服务器将启动于 http://0.0.0.0:7000,但可通过您的 GPU 主机名访问(例如,http://your-gpu-hostname:7000)以检索专利文档。

使用示例

如需全面的使用示例和测试模式,请参阅测试文件:

# View MCP tool usage examples
cat ToolUniverse/src/tooluniverse/test/test_mcp_tool.py

此测试文件包含与USPTO专利下载器MCP服务器交互的详细示例,包括正确的API调用和参数格式化。