四时宝库

程序员的知识宝库

python原始套接字socket下载http网页文件到txt

python原始套接字socket下载http网页文件到txt

import socket


def download_webpage(url, output_file):
    try:
        # 解析 URL
        if url.startswith("http://"):
            url = url[7:]
        host = url.split("/")[0]
        path = "/" + "/".join(url.split("/")[1:])

        # 创建 socket 对象
        client_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

        # 获取主机的 IP 地址
        ip = socket.gethostbyname(host)

        # 连接到服务器
        client_socket.connect((ip, 80))

        # 构建 HTTP 请求
        request = f"GET {path} HTTP/1.1\r\nHost: {host}\r\nConnection: close\r\n\r\n"
        client_socket.sendall(request.encode())

        # 接收响应
        response = b""
        while True:
            data = client_socket.recv(4096)
            if not data:
                break
            response += data

        # 关闭 socket
        client_socket.close()

        # 分离 HTTP 头部和内容
        header, content = response.split(b"\r\n\r\n", 1)

        # 保存内容到文件
        with open(output_file, "wb") as file:
            file.write(content)

        print(f"网页内容已成功保存到 {output_file}")
    except Exception as e:
        print(f"发生错误: {e}")


if __name__ == "__main__":
    url = "http://www.5a8.com"  # 替换为你要下载的网页 URL
    output_file = "www5a8com.txt"
    download_webpage(url, output_file)

pyinstaller打包Python文件为exe方法

1.安装Pyinstaller

通过包管理工具pip下载,类似于RedHat中的yum工具

pip install pyinstaller

Python 2.7.9 + 或 Python 3.4+ 以上版本都自带 pip 工具。如果没有安装pip,可以自行下载安装包安装:pip安装步骤

Successefully installed pip-xx.xx.xx 安装成功

2.打包python文件

通过python爬虫下载电影的网址和电影标题信息到excel表格中

本代码演示去电影网址上抓取电影网址和电影名称的数据,并保存到本机到excel表格中

操作步骤如下:

一、去百度上搜索查询要爬去的电影网址:

搜索到的电影网址为:
http://dianying.2345.com/list/guzhuang------.html,即我们今天要通过python进行get请求的网址

二、开始测试爬取网址:

python原始套接字socket下载https网页文件到txt

python原始套接字socket下载https网页文件到txt

import socket
import ssl


def download_https_webpage(url, output_file):
    try:
        # 解析 URL
        if url.startswith("https://"):
            url = url[8:]
        host = url.split("/")[0]
        path = "/" + "/".join(url.split("/")[1:])

        # 创建 socket 对象
        client_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

        # 获取主机的 IP 地址
        ip = socket.gethostbyname(host)

        # 使用 ssl 模块将 socket 包装为安全连接
        context = ssl.create_default_context()
        client_socket = context.wrap_socket(client_socket, server_hostname=host)

        # 连接到服务器
        client_socket.connect((ip, 443))

        # 构建 HTTP 请求
        request = f"GET {path} HTTP/1.1\r\nHost: {host}\r\nConnection: close\r\n\r\n"
        client_socket.sendall(request.encode())

        # 接收响应
        response = b""
        while True:
            data = client_socket.recv(4096)
            if not data:
                break
            response += data

        # 关闭 socket
        client_socket.close()

        # 分离 HTTP 头部和内容
        header, content = response.split(b"\r\n\r\n", 1)

        # 保存内容到文件
        with open(output_file, "wb") as file:
            file.write(content)

        print(f"网页内容已成功保存到 {output_file}")
    except Exception as e:
        print(f"发生错误: {e}")


if __name__ == "__main__":
    url = "https://www.5a8.com"  # 替换为你要下载的网页 URL
    output_file = "www5a8com.txt"
    download_https_webpage(url, output_file)
    

python安装与卸载(python3.5卸载)

一 python下载

1.1 什么是python解析器

python解释器是一款用于解释,执行python代码的应用程序

1.2. python解释器的下载

官网网站:https://www.python.org/

迈出Python学习第一步:Python开发环境的下载与安装

所谓“磨刀不误砍柴工”、“工欲善其事,必先利其器”,都在告诉我们一个道理:要做好一个事情,事先做好充分的准备工作是非常重要的。所以在我们正式学习用Python编程前,需要先搭建Python开发环境。

Python是一个跨平台的开发工具,可以在多个操作系统上进行编程,编写好的代码也可以在不同系统上运行,但对于个人学习阶段,小千推荐使用Windows操作系统。

Python爬虫,全网700多万本小说,可视化,手把手教你全自动下载

利用Python3.x环境进行编写。

给大家分享一个爬虫的小例子。免费爬去百万本小说,自动爬取和下载,小说网站的爬虫,我也是初学者,写的不是很好,请大神勿喷,谢谢!

S3 Uploader:S3 文件上传工具 GUI (Python)

S3 Uploader 是一款 S3 文件上传工具 GUI,使用 Python+Tkinter/ttk 编写,通过 Boto3 进行实际的 S3 交互。此外,S3 Uploader 使用 py2app 来创建一个独立的 OS X 应用,点击图标就可以启动;提供一个配置文件,可以进行上传文件的相关配置;主要提供给非技术人员使用。

Python爬虫,批量下载图片,你学会了吗?

Python这门语言,个人认为是开发爬虫,最简单方便的语言,学会了Python,工作上很多手工操作的事情,都可以交给它,你会发现是如此的高效!!!

生活中的Python,某天,看到一个设计的同事,在某图片网站上,一个个右键-另存,右键-另存的下载设计素材。操作了半天。她说,她觉得这些图片设计的不错,下载下来,存在电脑上,以后可以参考一下。但是一个个存,手都酸了...

python3中flask下载文件:图像.jpg

downloaserver.py:

#!/usr/bin/env python

# coding=utf-8

# 服务器端,下载图像.jpg

import flask

import os

app = flask.Flask(__name__)

<< 1 2 3 4 > >>
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言
    友情链接