分片传输和流量控制
分片传输和流量控制这其实是一个小功能,准备拆开来细谈一下,原来的功能是,整块数据进行上传到网关,然后由网关上传到HDFS,但是现在需要做一个新的解法。 因为原来的功能碰到了上传一个文件,第一个是文件太大了,一次性上传往往会占用太多的时间和空间,如果出现网络抖动,或者文件实在太大了挤满了,都会出现问题 ...
阅读更多
JVM调优
这个文章会依次表述本人经过的实践 首先是如何去发现问题,为什么要去调优? 我之前在做开源项目的时候,碰到了需要优化字节码大小问题的需求,所以,这里就用到了虚拟机优化的知识:在VM option里面增加参数 123-XX:+PrintCompilation-XX:+UnlockDiagnosticVM ...
阅读更多
Flink和Pulsar实践
实习中碰到的,等我更新
阅读更多
了解搜索架构
如果你想要深入的了解和熟悉搜索引擎,我可以推荐一本书:这就是搜索引擎 作者:张俊林出版社:电子工业出版社ISBN: 9787121148651 从本人了解到了知识储备而言,搜索引擎技术在工业界似乎变化不大,即使过去了很多年,整体的思想并没有发生很大的变化,来来回回都是这么个用法,召回,排序,求交,整 ...
阅读更多
搜一搜运营系统 WXG实践
搜一搜运营系统这个是实习中碰到的主要业务。 主要是搜索评估系统,需求是抓取数据,然后更新,并且评估。效果好的话放入理想集合,再放入拨测。 涉及Python,ClickHouse,Hive,MySQL,等多种技术 规则组配置系统,需求是配置搜索词,哪些搜索词会命中大卡,然后分批次发布。 涉及MQ等技术 ...
阅读更多
常见场景问题总结
常见场景题总结1.扫码登陆如何实现1.答:访问PC端二维码生成页面,PC端请求服务端获取二维码ID 服务端生成相应的二维码ID,设置二维码的过期时间,状态等。 PC获取二维码ID,生成相应的二维码。 手机端扫描二维码,获取二维码ID。 手机端将手机端token和二维码ID发送给服务端,确认登录。 服 ...
阅读更多
准召系统
准召平台的目的是打造一个评估系统,简而言之是将一些query放入到诊断系统当中,通过诊断结果去判断当前的算法有没有成功召回大卡,从而帮助算法工程师去进一步优化这个问题。 数据从何而来这里的数据来源会根据创造的评估任务的不同而不同,比如说,现在这里有两个评估功能。 准确评估一个功能是去创建一个准确任务 ...
阅读更多
SOFASTACK/SOFA-RPC
RPC这里会去介绍一下关于我的小小的开源经历 SOFASTACK/SOFA-RPC和Apache/fury看起来是两个,但是其实是一个,因为主要是在做如何将fury融入到sofa-rpc里面,这里做了很多工作,特别是要感谢 @EvenLjj @Lo1n @chaokunyang下面直接开始介绍:首 ...
阅读更多
零拷贝技术说明书
介绍零拷贝技术(Zero-copy)是一种优化数据传输和处理的技术,旨在减少数据在内存之间的复制次数,提高系统性能和效率。 在传统的数据传输过程中,当数据从一个缓冲区(如磁盘或网络)复制到另一个缓冲区(如应用程序的内存),通常需要经过多次数据复制操作。这些复制操作会占用CPU时间和内存带宽,降低系统 ...
阅读更多
大卡 WXG实践
大卡这个是实习中碰到的主要业务,混合C++,Python多种语言,比较复杂的后端项目
阅读更多