我们平时在刷抖音的时候, 经常会看到一些优秀的内容, 想要保存下来。然而尴尬的事情出现了,要么下载的视频有水印,要么视频不允许下载,这个时候是不是只能点赞兴叹。没关系,今天我们使用 Python 来一步一步将视频下载下来,而且没有水印。
先看一下运行结果:
运行完成后,在工程文件夹可以看到,视频已经下载到本地,并且没有水印
接下来, 我们详细讲解一下下载思路,其中使用了requests模块请求网络。
- 获取视频地址
点击电脑端分享, 选择复制链接(手机端同样的操作),然后就能获取到一下内容
3.56 h@O.xs dnd:/ 11/09 评论区抽一个人,没奖励,纯抽# 我的女团阵容 # 魔性律动舞 https://v.douyin.com/i8Br9jbr/ 复制此链接,打开Dou音搜索,直接观看视频!
使用正则提取分享链接中的短网址
share_url = input("请粘贴视频地址: ")
match = re.search(r"https://.*/", share_url)
抖音分享的链接中是短连接,直接访问得到的内容并不是实际的页面。因此我们需要分析从短连接到实际视频页面的是如何流转的。
- 分析短链接地址跳转
短链接是将较长的URL转换为一个较短的,易于记忆和分享的链接。
使用浏览器访问短连接地址,发现一共经过了两次重定向, 才最终跳到了实际的视频地址。
因此需要编写一个方法, 获取每次重定向的地址,多次跳转,我们可以递归调用,直到返回None。
# 获取重定向地址
def __get_redirect_url(url):
res = requests.get(url)
return res.history[0].headers['Location'] if len(res.history) > 0 else None
- 获取到重定向页面后,开始分析,页面中是如何获取视频播放地址
打开浏览器控制台在网络请求发现,视频链接是通过页面加载完成后,发起的XHR获取的, 其中请求param中aweme_id为视频id
知道请求后, 我们就可以构建链接请求,其中请求地址是固定的,请求参数动态传入
res = requests.get('https://www.douyin.com/aweme/v1/web/aweme/detail/',
params=_params, cookies=_cookies,
headers=_headers)
请求接口返回的是JSON数据,解析响应结果, 提取视频网址(响应结果其中包含了不同分辨率的视频,感兴趣的可以探索一下,这里使用默认清晰度)
video_url = res.json()["aweme_detail"]["video"]["play_addr"]["url_list"][0]
- 获取视频地址后,开始构建下载视频请求, 并将其保存文件中
with requests.get(video_url, headers={
"Referer": video_url,
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36',
}, timeout=60) as r, open("./video.mp4", mode="wb") as file:
视频下载过程中可能会需要等待一些时间,可以单独起一个线程去下载。
在上述获取视频地址的时候, cookie 中需要设置ttwid 和 s_v_web_id (两个值可以从浏览器 cookie 中获取), 否则, 很可能会触发验证码或者请求到空数据。网上有很多资料解释这两个值,感兴趣的可以自行搜索,本文不做过多描述。(以上方式在2023年12月16日使用有效,后续如果使用异常,可以评论区踢我以下)
有需要源代码的可以点赞,评论共同学习。