您的位置是:网站首页>Python编程Python编程

抖音好看的视频你想下载吗?

少儿编程网2020-10-16 13:23:13Python编程 人已围观 来源:少儿编程 -用户投稿

简介郑重申明:该文章介绍的技术仅供用于学习,不可恶意攻击抖音网站。对抖音服务器造成的任何损失,后果自负。具体的视频在如下链接地址:https://player.youku.com/embed/XNDY5MTU0ODg4OA==douyin.mp4需要用到的工具:**1、Chrome浏览器(如Chrome

A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

郑重申明:该文章介绍的技术仅供用于学习,不可恶意攻击抖音网站。对抖音服务器造成的任何损失,后果自负。A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

具体的视频在如下链接地址:https://player.youku.com/embed/XNDY5MTU0ODg4OA==A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

<iframe src="https://player.youku.com/embed/XNDY5MTU0ODg4OA==" scrolling="no" frameborder="0" align=""></iframe>

douyin.mp4A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

需要用到的工具:
**1、Chrome浏览器(如Chrome,装了httpwatch的IE浏览器等)+ charles(个人比较喜欢的抓包工具)
2. Pycharm(任何一个自己熟悉的编译器即可)A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

其实在该软件的编写过程中,个人认为是分为两个部分。
1.视频抓包地址的分析以及获取
2.界面逻辑代码的编写A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

一、视频地址的分析与抓取
1.我们先在自己的手机端的抖音软件上选取一个自己像下载的视频,并通过连接分享给别人A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

2.我们在Chrome上面输入上文的链接,并点击右键–设置–network 。再单独打开charles软件。点击回车键开始获取内容A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

我们会发现我们在浏览器初始输入的地址变成了下方的地址。其实这里涉及爬虫的一个重定向问题( 重定向(Redirect)就是通过各种方法将各种网络请求重新定个方向转到其它位置(如:网页重定向、域名的重定向、路由选择的变化也是对数据报文经由路径的一种重定向)。)A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

在这里的流程其实就是:先跳转到我填写的网址—根据当前网址的重定向信息获取到定向后的位置(即 location中的位置)A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

我们现在倒是能够打开视频进行播放了,但是我们怎么知道视频的实际地址在哪里呢?我们要如何进行下载呢?
A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

其实上面的图片即是我们这两个步骤在charles上对应的抓取到的信息。但是当我们点击播放键的时候,我们在charles上就能发现不一样的地方。下图是点击播放键以后抓取的信息
A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

细心的朋友可能会看到,当我们点击视频的时候他会自动跳转到一个地址,并进行缓存。但是这个地址的是在哪里找呢?这是**关键的一步。
A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

通过仔细的分析,我发现视频的播放地址藏在 这个地址的响应体里面(这是一个随时变化的地址,我们在这里通过正则表达式能够很好的获取)A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

当我们获取到这个地址以后,继续发送请求发现该地址也是一个重定向地址,其实视频的**终地址是在下图(也就是图四进行视频缓存的地址):
A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

对该地址发送请求以后,会发现他它的响应体是字节流(我们直接将二进制流写入文件即可保存)
A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

二、界面逻辑代码
A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

界面搭建所需要的组件和布局其实每个人都有自己的理解和审美,所以这里仅仅展示上面对地址的抓取和视频下载。A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

import requests
import re
import random
import time
from PyQt5.Qt import *

class api(QObject):
    downSignal = pyqtSignal(list)
    def __init__(self,url,saveFilename):
        """
        :param url: 视频地址
        :param saveFilename: 保存的文件名
        """
        super(api, self).__init__()
        self.session = requests.session()
        self.url = url
        self.savename = saveFilename
        userAgent = [
            "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.163 Safari/535.1",
            "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:6.0) Gecko/20100101 Firefox/6.0",
            "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50",
            "Opera/9.80 (Windows NT 6.1; U; zh-cn) Presto/2.9.168 Version/11.50"]
        key = random.randint(0, 3)
        self.headers = {'content-type': 'application/json', 'User-Agent': userAgent[key]}

    def getdoumload(self):
        """
        作用:获取**终的视频的下载地址
        :return: 
        """
        
        try:
            url =self.url
            rep = self.session.get(url, headers=self.headers, verify=False)  # 获取跳转的链接
            self.downLoadUrl = re.findall("playAddr:(.*)", rep.text)[0].split('"')[1]  # 获取视频的下载地址,会进行重定向
        except:
            self.downLoadUrl = "parse error"
        return self.downLoadUrl



    def downLoadVideo(self):
        """
        作用:对视频文件进行保存,并发送信号给主界面
        :return: 
        """
        try:
            r = self.session.get(self.downLoadUrl, headers = self.headers,verify = False)
            length = float(r.headers['content-length'])
        except:
            return False
        count = 0
        time1 = time.clock()

        with open(self.savename, 'wb') as f:
            for chunk in r.iter_content(chunk_size=512):
                if chunk:
                    f.write(chunk)
                    count += len(chunk)
                    p = count / length * 100
                    intervals = time.clock() - time1
                    speed = count / 1024 / 1024 / intervals
                    self.downSignal.emit([p, speed])




if __name__ == '__main__':
    url = " https://v.douyin.com/J1cGcN5/"
    apt = api(url,"./xx.mp4")
    if apt.getdoumload() != "parse error":
        apt.downLoadVideo() 

一个自己无聊做的小玩具,欢迎各位大神指出我的不足和错误,共同进步。A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台


    更多python有关文章,请关注python自学网。

来源:php中文网A7F少儿编程网-Scratch_Python_教程_免费儿童编程学习平台


相关文章:

支持一下 ( )

抖音好看的视频你想下载吗?

      匿名评论
    • 评论
    人参与,条评论
    抖音好看的视频你想下载吗?

微信公众号

免费视频教程

先知道