加入收藏 | 设为首页 | 会员中心 | 年终奖计算器 | RSS
您当前的位置:首页 > 新手会计 > 电算化

批量替换网页链接 (根据内容替换文本、图片的链接地址)

时间:2024-04-14 09:12:48  来源:  作者:

批量替换网页链接 (根据内容替换文本、图片的链接地址)代码:
使用编程语言(如Python)和相关的库(如Beautiful Soup)来解析HTML,并替换链接。
下面是一个简单的Python示例代码,演示如何使用Beautiful Soup来批量更改网页中的链接:(红色的部分替换成自己的

from bs4 import BeautifulSoup

# 读取原始网页内容
original_file_path = "D:/pyweb/4166.html"
with open(original_file_path, 'r', encoding='utf-8') as original_file:
    original_content = original_file.read()

# 读取目标网页内容
target_file_path = "D:/pyweb/index.html"
with open(target_file_path, 'r', encoding='utf-8') as target_file:
    target_content = target_file.read()

# 使用Beautiful Soup解析HTML
soup_original = BeautifulSoup(original_content, 'html.parser')
soup_target = BeautifulSoup(target_content, 'html.parser')

# 获取原始网页中的文本链接部分内容
original_links = {link.get_text(): link.get('href') for link in soup_original.find_all('a')}

# 遍历原始网页中的文本链接部分内容,并在目标网页中查找包含相同部分内容的链接
for original_link_text, original_link_href in original_links.items():
    for link_target in soup_target.find_all('a'):
        link_target_text = link_target.get_text()
        if original_link_text in link_target_text:
            print("Match found for text:", original_link_text)
            # 替换原始网页中的文本链接
            for link_original in soup_original.find_all('a', text=original_link_text):
                link_original['href'] = link_target['href']
                print("Replaced text link.")
                break

# 遍历原始网页中的图片标签
for img_original in soup_original.find_all('img'):
    # 获取图片标签的alt属性
    img_original_alt = img_original.get('alt')
    if img_original_alt:
        # 在原始网页中找到相同文本内容的链接
        text_link_original = soup_original.find('a', text=img_original_alt)
        if text_link_original:
            # 获取原始文本链接的地址
            text_link_original_href = text_link_original['href']
            # 获取图片标签的父级链接
            parent_a_original = img_original.find_parent('a')
            if parent_a_original:
                # 将图片的父级链接替换为原始网页中相同文本链接的地址
                parent_a_original['href'] = text_link_original_href
                print("Replaced image link:", text_link_original_href)

# 将修改后的HTML写回文件
with open(original_file_path, 'w', encoding='utf-8') as modified_file:
    modified_file.write(str(soup_original))

print("链接替换完成。")


 

请按照以下步骤在命令行中运行脚本:

  1. 打开命令行界面(Command Prompt或者Terminal)。
  2. 运行以下命令:python replace_links.py

这样做将执行 replace_links.py 文件中的Python代码,并在命令行中输出结果。
参考:
Python安装教程可以百度下

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
来顶一下
返回首页
返回首页
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
推荐资讯
2024小微企业所得税优惠政策
2024小微企业所得税优
全国各地电子税务局网址
全国各地电子税务局网
电子税务局进项发票勾选认证抵扣操作流程
电子税务局进项发票勾
全国工会预决算编报网址
全国工会预决算编报网

相关文章
栏目更新
栏目热门