Python 提取 TIF 中地名的完整指南

一、先明确：TIF 中的地名有哪两种存在形式？

在开始提取前，需先判断 TIF 文件的类型 —— 这直接决定了后续的技术方案。两种核心形式的差异如下：

地名存在形式	适用 TIF 类型	核心特征	提取思路
地理矢量属性字段	GeoTIFF（带地理空间信息）	地名存储在矢量要素的属性表中（如 Shapefile 关联的 “NAME” 字段），TIF 本身是栅格底图，地名不直接显示在图像上	读取 TIF 的地理元数据→关联矢量图层→提取属性字段中的地名
图像可视化文字	普通 TIF（如扫描地图、航拍图）	地名是图像像素的一部分（如 “北京市朝阳区” 标注文字），无结构化属性，需识别图像内容	图像预处理（去噪、灰度化）→OCR 文字识别→筛选地名

二、场景 1：提取 GeoTIFF 中的矢量属性地名（结构化数据）

GeoTIFF 是带有地理空间参考信息的 TIF 文件，常与矢量数据（如 Shapefile、GeoJSON）配套使用 —— 地名通常存储在矢量要素的属性表中（如居民点要素的 “NAME” 字段、道路要素的 “ROAD_NAME” 字段）。这种场景下，提取本质是 “读取地理数据的属性信息”，核心依赖 GIS 相关库。

1. 核心工具库

GDAL/OGR：地理数据处理的底层库，支持读取 GeoTIFF 的元数据及关联的矢量文件；
Geopandas：基于 Pandas 的 GIS 扩展库，简化矢量数据的读取与属性筛选，适合处理带地名的矢量图层；
Fiona：轻量级矢量数据读取库，常与 Geopandas 配合使用，支持 Shapefile、GeoJSON 等格式。

2. 前提条件

需获取与 GeoTIFF 配套的矢量文件（如 Shapefile 格式的.shp文件，通常包含.shp/.shx/.dbf/.prj四个文件）；
矢量文件的属性表中需包含地名字段（如 “NAME”“地名”“CNAME”，可通过 QGIS、ArcGIS 查看字段名）；
GeoTIFF 与矢量文件需空间参考一致（如均为 WGS84 坐标系），避免空间匹配偏差。

3. 实战步骤：提取居民点地名

假设我们有一份 “某区域 GeoTIFF 底图”，配套的residential.shp矢量文件包含居民点要素，属性表中 “NAME” 字段存储地名。

步骤 1：安装依赖库

GIS 库在 Windows 环境下直接用pip安装可能报错，建议用conda（Anaconda/Miniconda）安装：

# 创建conda环境（可选）

conda create -n gis_env python=3.9

conda activate gis_env

# 安装核心库

conda install -c conda-forge gdal geopandas fiona pandas

步骤 2：读取矢量文件并提取地名

import geopandas as gpd

import pandas as pd

# 1. 读取Shapefile矢量文件（包含居民点要素）

# 注意：需确保.shp/.shx/.dbf/.prj文件在同一目录

gdf = gpd.read_file("residential.shp")

# 2. 查看矢量数据的基本信息（确认字段名与地名字段）

print("矢量数据字段名：", gdf.columns.tolist())  # 输出如['FID', 'NAME', 'POP', 'geometry']

print("n前5条数据的地理类型：", gdf.geom_type.head())  # 确认是Point（点要素，对应居民点）

# 3. 筛选地名字段，去重并保存

# 提取"NAME"字段中的地名，排除空值和重复值

place_names = gdf["NAME"].dropna().drop_duplicates().tolist()

# 4. 查看结果并保存为CSV

print("n提取的地名列表（前10个）：")

print(place_names[:10])  # 输出如['张三村', '李四镇', '王五社区', ...]

# 保存为CSV，便于后续使用

pd.DataFrame({"地名": place_names}).to_csv("extracted_place_names.csv", index=False, encoding="utf-8")

print("n地名已保存至 extracted_place_names.csv")

步骤 3：（可选）关联 GeoTIFF 的空间范围筛选地名

若需提取 “GeoTIFF 底图覆盖范围内” 的地名（排除矢量文件中超出底图的要素），需先获取 GeoTIFF 的空间范围，再筛选矢量要素：

from osgeo import gdal

# 1. 读取GeoTIFF，获取其空间范围（边界框）

def get_geotiff_bbox(tif_path):

   dataset = gdal.Open(tif_path)

   if not dataset:

       raise ValueError("无法打开GeoTIFF文件")

   # 获取地理变换参数（左上角坐标、分辨率等）

   geotransform = dataset.GetGeoTransform()

   # 计算边界框（min_x, min_y, max_x, max_y）

   min_x = geotransform[0]

   max_y = geotransform[3]

   max_x = min_x + dataset.RasterXSize * geotransform[1]

   min_y = max_y + dataset.RasterYSize * geotransform[5]

   dataset = None  # 关闭文件

   return (min_x, min_y, max_x, max_y)

# 2. 获取GeoTIFF的边界框

tif_bbox = get_geotiff_bbox("region.tif")  # 替换为你的GeoTIFF路径

min_x, min_y, max_x, max_y = tif_bbox

# 3. 筛选矢量要素中在边界框内的地名

# 创建边界框的Polygon几何对象

from shapely.geometry import box

bbox_geometry = box(min_x, min_y, max_x, max_y)

# 筛选与边界框相交的居民点要素

gdf_in_bbox = gdf[gdf.intersects(bbox_geometry)]

# 提取地名

place_names_in_bbox = gdf_in_bbox["NAME"].dropna().drop_duplicates().tolist()

print("GeoTIFF范围内的地名数量：", len(place_names_in_bbox))

print("GeoTIFF范围内的地名（前10个）：", place_names_in_bbox[:10])

三、场景 2：提取普通 TIF 图像中的文字地名（非结构化数据）

若 TIF 是普通图像（如扫描的纸质地图、无人机航拍图），地名是图像上的可视化文字（如印刷体标注），则需通过OCR（光学字符识别） 技术提取。这种场景的核心是 “将图像文字转化为文本”，再通过简单筛选得到地名。

1. 核心工具库

PIL/Pillow：Python 图像处理库，用于 TIF 图像的读取、预处理（灰度化、二值化、去噪）；
EasyOCR：轻量级 OCR 库，支持多语言（含中文），识别准确率高于传统的 Tesseract，且无需复杂配置；
OpenCV（可选）：用于更复杂的图像预处理（如边缘检测、文字区域定位），提升 OCR 准确率。

2. 前提条件

TIF 图像中的地名需清晰可辨（避免模糊、倾斜、遮挡，否则 OCR 准确率会大幅下降）；
若识别中文地名，需确保 OCR 库已下载中文模型（EasyOCR 会自动下载，首次运行需联网）。

3. 实战步骤：OCR 识别 TIF 中的地名

假设我们有一份扫描的纸质地图 TIF（scan_map.tif），图像上有 “XX 路”“XX 镇” 等地名标注。

步骤 1：安装依赖库

# 安装Pillow和EasyOCR

pip install pillow easyocr opencv-python

步骤 2：图像预处理（提升 OCR 准确率）

普通 TIF 图像可能存在噪声、颜色干扰，需先预处理：

灰度化：将彩色图像转为灰度图像，减少颜色通道干扰；
二值化：将灰度图像转为黑白二值图像，突出文字与背景的对比；
去噪：去除图像中的小点、杂色，避免 OCR 误识别。

from PIL import Image

import numpy as np

import cv2

def preprocess_tif(tif_path):

   # 1. 读取TIF图像（支持多页TIF，此处取第一页）

   img = Image.open(tif_path)

   if img.mode == "CMYK":

       img = img.convert("RGB")  # 处理CMYK格式图像

   # 转为OpenCV格式（BGR通道）

   img_cv = cv2.cvtColor(np.array(img), cv2.COLOR_RGB2BGR)


   # 2. 灰度化

   gray = cv2.cvtColor(img_cv, cv2.COLOR_BGR2GRAY)


   # 3. 二值化（自适应阈值，适合光照不均匀的图像）

   # THRESH_BINARY_INV：文字为白色，背景为黑色

   thresh = cv2.adaptiveThreshold(

       gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV, 11, 2

   )



   # 4. 去噪（ morphological opening，先腐蚀再膨胀）

   kernel = np.ones((2, 2), np.uint8)

   denoised = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=1)


   # 转回PIL图像，便于后续OCR

   img_preprocessed = Image.fromarray(cv2.cvtColor(denoised, cv2.COLOR_BGR2RGB))

   return img_preprocessed

# 预处理TIF图像

preprocessed_img = preprocess_tif("scan_map.tif")

# 保存预处理后的图像（可选，用于检查效果）

preprocessed_img.save("preprocessed_map.png")

print("预处理完成，图像已保存至 preprocessed_map.png")

步骤 3：EasyOCR 识别文字并筛选地名

OCR 会识别图像中的所有文字（如数字、符号、无关说明），需通过 “地名特征” 筛选（如含 “市”“县”“镇”“村”“路”“街” 等关键词）：

import easyocr

def extract_place_names_from_ocr(img):

   # 1. 初始化EasyOCR阅读器（仅加载中文模型，减少内存占用）

   # lang_list=["ch_sim"]：中文简体，如需英文可加["en"]

   reader = easyocr.Reader(lang_list=["ch_sim"], gpu=False)  # gpu=True需安装CUDA


   # 2. 识别图像文字（返回结果：[(文字区域坐标, 文字内容, 置信度)]）

   result = reader.readtext(np.array(img))


   # 3. 筛选地名：保留含地名关键词的文字，且置信度>0.5（过滤低准确率结果）

   place_keywords = ["市", "县", "区", "镇", "乡", "村", "社区", "路", "街", "巷", "大道"]

   place_names = []

   for bbox, text, confidence in result:

       if confidence > 0.5 and any(keyword in text for keyword in place_keywords):

           # 去除文字中的空格、换行符

           clean_text = text.strip().replace("n", "")

           place_names.append(clean_text)


   # 4. 去重并返回

   return list(set(place_names))  # set去重

# 提取地名

place_names_ocr = extract_place_names_from_ocr(preprocessed_img)

# 查看结果

print("nOCR提取的地名列表：")

for name in place_names_ocr:

   print(name)  # 输出如['朝阳路', '海淀镇', '中关村社区', ...]

# 保存结果

import pandas as pd

pd.DataFrame({"OCR提取地名": place_names_ocr}).to_csv("ocr_place_names.csv", index=False, encoding="utf-8")

print("nOCR提取的地名已保存至 ocr_place_names.csv")

步骤 4：优化 OCR 准确率的技巧

若识别结果中存在大量错误（如 “朝阳路” 识别为 “朝阳铬”），可尝试以下优化：

调整二值化阈值：若文字模糊，可减小adaptiveThreshold的blockSize（如从 11 改为 9）；
文字区域定位：用 OpenCV 的findContours找到文字轮廓，仅对文字区域进行 OCR，减少背景干扰；
更换 OCR 库：若 EasyOCR 效果不佳，可尝试pytesseract（需安装 Tesseract 引擎，支持自定义训练模型）；
图像旋转矫正：若 TIF 图像倾斜，用cv2.getRotationMatrix2D旋转矫正后再识别。

四、两种场景的对比与选择建议

对比维度	场景 1：GeoTIFF 矢量属性地名	场景 2：普通 TIF 图像文字地名
数据结构化程度	高（地名存储在属性表，可直接读取）	低（需 OCR 识别，结果需筛选）
提取准确率	近 100%（只要矢量数据正确）	中等（受图像质量、OCR 模型影响，通常 70%-95%）
依赖文件	需配套矢量文件（如 Shapefile）	仅需 TIF 图像本身
核心工具库	GDAL、Geopandas、Fiona	Pillow、EasyOCR、OpenCV
适用场景	GIS 项目、专业地理数据处理	扫描地图、航拍图、无矢量的历史地图

选择建议：

优先确认 TIF 类型：若 TIF 是从 GIS 软件导出的 GeoTIFF，先检查是否有配套矢量文件，优先用场景 1 的方法（准确率高、效率快）；
无矢量数据时用 OCR：若仅能获取普通 TIF 图像（如历史地图扫描件），则采用场景 2 的 OCR 方案，需做好图像预处理；
混合场景处理：若 GeoTIFF 底图上有额外的图像文字地名（如临时标注），可结合两种方法 —— 先提取矢量属性地名，再用 OCR 补充图像文字地名。

五、常见问题与解决方案

问题 1：GeoTIFF 无法关联矢量文件

原因：两者空间参考不一致（如 GeoTIFF 是 GCJ02 坐标系，矢量是 WGS84）。

解决方案：用 Geopandas 的to_crs统一坐标系，如gdf = gdf.to_crs(epsg=4326)（转为 WGS84）。
问题 2：TIF 图像太大，OCR 内存溢出

原因：EasyOCR 处理大图像（如分辨率 > 5000×5000）时占用内存过高。

解决方案：将图像按网格分割为小块（如 500×500 像素），分别 OCR 后合并结果。
问题 3：矢量文件中无明确的地名字段

原因：字段名非 “NAME”，可能是 “DZM”“MC” 等中文拼音缩写。

解决方案：用gdf.head()查看属性表内容，找到包含地名的字段（如 “DZM” 字段值为 “张三村”）。

六、总结

Python 提取 TIF 中的地名，核心是 “根据 TIF 文件类型选择对应技术路径”—— 对于结构化的 GeoTIFF 矢量数据，利用 GIS 库直接读取属性字段是最优解；对于非结构化的图像文字，通过 “预处理 + OCR” 是唯一可行方案。无论哪种场景，都需关注数据质量（矢量数据完整性、图像清晰度）与工具库适配（GIS 库的空间参考、OCR 库的语言模型）。掌握这两种方法，可覆盖绝大多数 TIF 地名提取需求，为地理信息分析、地图数字化等工作提供数据支撑。