抖音热书

第82章 领先一代半的算法

猪熊提示您:看后求收藏(抖音热书douyinreshu.com),接着再看更方便。

而此时处在舆论漩涡之中的林灰在干什么呢?

当然是在废寝忘食地查阅那些跨越时空的“参考资料”。

这里面有价值的信息太多了。

很多在后世平平无奇的东西放到眼下这个时空中都是乱杀的存在。

但林灰没有被激动的情绪所左右。

因为林灰始终清楚领先半步是先驱,领先一步是先烈。

技术真领先个一年半载还好说,冷不丁一下子领先别人四五年就出大问题了。

只有能够契合14年这个时代背景的技术才是林灰寻找的有价值的东西。

在前世那部thinkpad里几乎没翻找多长时间。

林灰就找到了他的猎物:

——生成/抽取复合式新闻摘要算法。

这种算法在前世并不算特别新鲜的玩意。

林灰之所以看中它是因为这个算法成熟。

某种程度上成熟就意味着稳定、性能可靠。

林灰几乎可以不再经过额外的调教就直接拿这种算法开发之前他构想的那个新闻摘要软件。

当然了,这个算法也只是在前世那个时空不算新鲜而已。

放到14这个时空里,依旧是领先一年的技术。

虽然只领先一年,也完全够用了。

就算是只领先半年,也照样让你绝望!

你没打破我垄断之前,我各种高价讹诈赚取巨额利润。

你打破我垄断了,我直接白菜价跟着你一块摆烂。

气不气?

别人气不气不知道。

反正兔子已经气得想咬人了。

更何况算法这种东西迭代本来就快!

领先一年时间几乎等同于技术方面领先一代了。

而生成/抽取复合式新闻摘要算法更是领先14年这个时空主流新闻摘要算法一代半。

这可不是林灰夸张。

事实上,现在的新闻摘要自动生成的方式还是抽取式新闻摘要。

抽取式顾名思义就是按照一定的权重从新闻原文中寻找跟中心思想最接近的一条或几条句子。

抽取式摘要还在用着“古老”的textrank排序算法。

这种算法大体思想是先去除文章中的一些停用词,之后对句子的相似度进行度量,计算每一句相对另一句的相似度得分,迭代传播,直到误差小于0.0001。

之后再对上述得到的关键语句进行排序,以期能得到想要的摘要。

更多内容加载中...请稍候...

本站只支持手机浏览器访问,若您看到此段落,代表章节内容加载失败,请关闭浏览器的阅读模式、畅读模式、小说模式,以及关闭广告屏蔽功能,或复制网址到其他浏览器阅读!

小说推荐:《封神:开局被抽龙筋》《玄鉴仙族》《仗剑独行斩鬼神》《馥欲香片》《精神病在废土当万人迷》《洞中避难所》《疫病之上》《山海提灯》《我的梦境可以捡到至宝》《我用游戏改变了时间线

新书推荐

随身带着俩亩地吸金大富豪手机制造商放开我女儿青龙白滚汤昔阳面馆华尔街门诊部脑部动漫制造机幽梦的奴隶百合日记重生之财富天下美饮供应商首尔星光食材供应商我才是真正的主神韩娱养成环保使者墨骗之天厌娱乐之王韩城谍影我在异界有座庙黑金帝国异变之初传媒巨子厨子在韩娱宠物贩子的奋斗环保大师卡牌大明星文学大宗师神级紫荆花牧场逆袭黄金时代神仙农场诸天扫码成神重生之无节操系统茶道传承系统韩娱之通娱眼文娱行者文青是不是种病文艺界奇葩都市神灵艺人我的能力很变态