最近在抓取一些比较有价值的网站资源,用于训练AI写作系统,保证AI能在我采集的庞大数据库中学会利用一个命题就可以创作高质量原创文章。对!我说的是
2024年08月16日
最近在抓取一些比较有价值的网站资源,用于训练AI写作系统,保证AI能在我采集的庞大数据库中学会利用一个命题就可以创作高质量原创文章。对!我说的是
2024年08月16日
在使用IDE进行编程过程中,经常会遇到需要重复的进行某个动作来完成一段很长的代码。这个时候是我最不愿意进行下去的时候。我通常会寻找一些小技巧和方法替代重复劳动。即便是这样的方法所花费的时间和你一行一行重复劳动完成代码所花费的时间是一样的,我也觉得是值得的!因为:
1、你做的不是重复的事情;不至于枯燥,有时还带有一些乐趣;
2024年08月16日
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
任务:使用正则提取豆瓣电影数据
思路:1、获取html内容文本
2、准备正则表达式
3、使用finditet()方法,对html文本一次性提取数据生成可迭代的对象
4、循环遍历可迭代对象,使用groupdict()方法生成字典
5、把字典的值valuse写入csv文件。
@author: wangxingchun
"""
import requests
import re
import csv
url = 'https://movie.douban.com/chart'
head = {'user-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.99 Safari/537.36'}
sep = requests.get(url,headers=head)
connect = sep.text
#预处理正则表达式
zhze = re.compile(r'<span style="font-size:13px;">(?P<name>.*?)</span>.*?'
r'<span class="rating_nums">(?P<nums>.*?)</span>.*?'
r'<span class="pl">\((?P<pingjia>.*?)人评价.*?',re.S)
#正式解析网页源码,生成可迭代对象(fniditer)
result = zhze.finditer(connect)
#写模式创建一个csv文件,生成字典逐行写入values
with open('data.csv','w') as f:
#设置csv写入方法
witers = csv.writer(f)
for it in result:
#print(it.group('name'))
#print(it.group('nums'))
#print(it.group('pingjia'))
#生成字典格式
dic = it.groupdict()
# print(dic)
#按行写入csv文件
witers.writerow(dic.values())
print('over')
2024年08月16日
一、新建数据源配置
因考虑到多数据源问题,代码生成器作为一个通用的模块,后续可能会为其他工程生成代码,所以,这里不直接读取系统工程配置的数据源,而是让用户自己维护。
2024年08月16日
ADAS系统是协助司机驾驶车辆的电子系统。ADAS系统可以直接影响汽车的一些部件,目的是为了从完成更安全和更舒适的驾驶的角度开发各种有用的功能:从自动点火灯和交通标志识别到与智能手机的整合。
2024年08月16日
用于连接数据库后根据模板生成文件
<dependency>
<groupId>com.baomidou</groupId>
<artifactId>mybatis-plus</artifactId>
<version>3.0.6</version>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-freemarker</artifactId>
</dependency>
<dependency>
<groupId>mysql</groupId>
<artifactId>mysql-connector-java</artifactId>
<version>5.1.25</version>
</dependency>
2024年08月16日
选自arXiv
机器之心编译
参与:Jane W、蒋思源
哥本哈根的一家初创公司 UIzard Technologies 训练了一个神经网络,能够把图形用户界面的截图转译成代码行,成功为开发者们分担了部分网站设计流程。令人惊叹的是,同一个模型能跨平台工作,包括 iOS、Android 和 Web 界面,从目前的研发水平来看,该算法的准确率达到了 77%。
2024年08月16日
本文原文地址https://blog.csdn.net/xindoo/article/details/106458165
在上篇博客从0到1打造正则表达式执行引擎(一)中我们已经构建了一个可用的正则表达式引擎,相关源码见https://github.com/xindoo/regex,但上文中只是用到了NFA,NFA的引擎建图时间复杂度是O(n),但匹配一个长度为m的字符串时因为涉及到大量的递归和回溯,最坏时间复杂度是O(mn)。与之对比DFA引擎的建图时间复杂度O(n^2),但匹配时没有回溯,所以匹配复杂度只有O(m),性能差距还是挺大的。