33、经典搜索核心算法:语言模型及其变种

在信息检索和文本挖掘领域,我们之前已经讲过了TF-IDF算法和BM25算法。TF-IDF因其简单和实用常常成为很多信息检索任务的第一选择,BM25则以其坚实的经验公式成了很多工业界实际系统的重要基石。 然而,在信息检索研究者的心里,一直都在寻找一种既...

AI技术内参

32、经典搜索核心算法:BM25及其变种(内附全年目录)

周一我们讲了TF-IDF算法和它的四个变种,相对于TF-IDF而言,在信息检索和文本挖掘领域,BM25算法则更具理论基础,而且是工程实践中当仁不让的重要基线(Baseline)算法 。BM25在20世纪70年代到80年代被提出,到目前为止已经过去二三...

AI技术内参

31、经典搜索核心算法:TF、IDF及其变种

从本周开始我们进入人工智能核心技术模块,本周我会集中讲解经典的搜索核心算法,今天先来介绍TF-IDF算法。 在信息检索(Information Retrieval)、文本挖掘(Text Mining)以及自然语言处理(Natural Language...

AI技术内参

30、ACL 2018论文精读:什么是“端到端”的语义哈希

今天,我们来看今年ACL大会的一篇最佳论文提名,题目是《NASH:面向生成语义哈希的端到端神经架构》(NASH: Toward End-to-End Neural Architecture for Generative Semantic Hashin...

AI技术内参

29、ACL 2018论文精读:什么是对话中的前提触发如何检测

今天,我来和你分享ACL 2018的第二篇最佳论文,题目是《让我们“再”次做到:检测副词前提触发词的第一种计算方法》(Let’s do it “again”: A First Computational Approach to Detecting A...

AI技术内参

28、ACL 2018论文精读:问答系统场景下,如何提出好问题

今年7月15日~20日,计算语言学协会年会ACL 2018(56th Annual Meeting of the Association for Computational Linguistics),在澳大利亚的墨尔本举行,这是自然语言处理和计算语言...

AI技术内参

27、ICML 2018论文精读:优化目标函数的时候,有可能放大了“不公平”

今天我们要分享的是ICML 2018的一篇最佳论文提名,题目是Fairness Without Demographics in Repeated Loss Minimization。 这篇论文讨论了这样一个话题,在优化目标函数的时候,如何能够做到针对...

AI技术内参

26、ICML 2018论文精读:聊一聊机器学习算法的“公平性”问题

在上一次的分享里,我们介绍了今年ICML大会的一篇最佳论文,这是一篇非常优秀的机器学习和计算机安全相结合的论文。这篇论文剖析了目前在白盒攻击的场景下,攻击方如何绕过一种叫作“混淆梯度”的情况,来实现有效攻击的目的。 今天,我们来分享ICML 2018...

AI技术内参

25、ICML 2018论文精读:模型经得起对抗样本的攻击这或许只是个错觉

2018年7月10日~15日,国际机器学习大会ICML 2018(The 35th International Conference on Machine Learning),在瑞典的斯德哥尔摩举行。 ICML从1980年开始举办,已有30多年的历史...

AI技术内参

24、CVPR 2018论文精读:如何解决排序学习计算复杂度高这个问题

今天,我们来看这次大会的一篇最佳论文提名,标题是《基于排序的损失函数的有效优化》(Efficient Optimization for Rank-based Loss Functions)。 还是先简单介绍下论文的作者群。这篇论文的作者来自好几个不同...

AI技术内参
15051525354268