- 使用
- 示例
- 源码解析
使用
在flink 1.11中,内置提供了一个DataGen 连接器,主要是用于生成一些随机数,用于在没有数据源的时候,进行流任务的测试以及性能测试等。下面我们简单的聊聊如何来使用以及底层源码是如何实现的。
2024年10月15日
在flink 1.11中,内置提供了一个DataGen 连接器,主要是用于生成一些随机数,用于在没有数据源的时候,进行流任务的测试以及性能测试等。下面我们简单的聊聊如何来使用以及底层源码是如何实现的。
2024年10月15日
互联网目前已经成为了人们在日常生活中不可或缺的一分部,我们的CP时代,工作生活与互联网牢牢结合;在智能手机的移动互联网时代,我们已经开始与互联网产生了密不可分的联系。现在,我们已经开始迈入了互联网3.0的时代Web3.0。Web3.0不仅是业务模式、浏览习惯与体验的更新和升级,也离不开底层技术的不断升级和演化。目前互联网中的数据具有高度的依赖性、关联性、多样性和易变性,用户在使用过程中也经常遇到请求无法满足的情况,比如我们主动使用搜索引擎搜索关键词时、浏览网站或使用软件程序时产生大量的信息冗余、大量的无关内容,这些问题给用户带来了极大的困扰。未来解决这些问题提高用户满意度,我们需要根据互联网数据特点及业务需求对数据请求进行分级扩展和优化,减少网络中的数据请求数量,并通过实际系统进行验证来提高系统性能、提升请求有效性。
2024年10月15日
按数据生成规则模拟数据。在开发和演示场景下使用比较方便。具体可以查看Flink官方DataGen connector。
2024年10月15日
最近做一个邀请码功能,一直没找到感觉很完美的方法,然后自己造了一个轮子,当然效果还不是很完善。
首先我认为邀请码需要有以下特性:
1、唯一性,不能出现两个场景下生成一样的邀请码。
2、不规律性,至少在字面上不能猜出规律来。
3、高效性,生成邀请码的算法不能太过复杂,或者太消耗性能。
理论上用时间戳生成的数字串基本上是唯一的,如果经过一定规则的打乱顺序,然后进行字母映射的话,字面上的规律还是不怎么可能直接看出来的。但是时间戳有一个不好的地方,就是长度太长了,当前我想要使用的场景下,邀请码推荐是生成6位的,6位用完了才会去使用更长的。此外,对于长度短的随机算法,出现冲突,去重的过程不管从空间上还是时间上去解决都一定程度上消耗性能。
2024年10月15日
大家好,我很高兴再次写作,因为这是我今年的目标之一,尝试在网上出现并获得新的爱好,比如写博客,我从小就觉得这很有吸引力,但坚持不懈从来都不是我的强项之一,但是 从现在开始,我会尽我最大的努力去改变它。 好的,我说的够多了,现在让我们进入主题“随机名称生成器”。
2024年10月15日
最近接触了些破译方面的东东,主要是加密和解密的一些算法和流程。对于暴力破解的手段,密码字典也是个挺关键的步骤呢。下面学习个密码生成器的python代码。
2024年10月15日
在制作各种模拟数据时,经常要模拟姓名,虽然现在各种的真实数据也很容得到,但是却有侵犯隐私的风险。
给位自媒体作者,必须要守住底线。
模拟姓名对与Excel来说是很简单的事情。
第一步:找个百家姓,去掉标点符号,放到一个单元格里备用。
第二步:找1200个能做名字用的汉字放到另外一个单元格里。
第三步:写公式随机提取姓氏与名字组合起来。
这是一个MID和RANDBETWEEN函数组合起来的公式:
2024年10月15日
大前天,我发一个反思的文章,老是感觉有很多重要的东西没有写出来,不过,我想表达的意思基本上已经写出来了,没办法,我不太擅长表达,从我写的文章中你们应该也能看出来,我表达能力方面还需要加强。
不说上篇文章的事了,下面说一下我前几天利用有赞微商城做“一元夺宝”时,发现的一个小工具吧,就是随机生成工具。
为什么我会找到这个软件呢,因为我看这个一元夺宝教程的时候,说要用到优惠码的码库,然后我就想了,这个码库怎么来的呢?那么多的随机码不可能是自己想吧,肯定有生成的工具,于是我就找到一个随机码生成工具。