人工智能概论

Content Team September 24, 2020

Share it :

人工智能概论

由Paul Reilly撰文,AI工程师、flashbitch.com的创始人,该网站主要为AI生成的赌场评论网站;同时为技术爱好者和演讲者

经历了长达20年的SEO生涯后,Paul将注意力转向了人工智能的实际应用,这使得他在探索赌场代理新方法的同时,还经常到大学人工智能研究团队中去。

人工智能是一个如此广泛的领域,它正以飞快的速度向前发展,这个主题的巨大信息堆可能会让人感到相当吃力。 

在接下来的几个月里,我会从自己的经历、学习资源、工具、数据集等方面分享人工智能的入门概述、概念、方法、实际应用。我会分析许多用于近似人脑功能的算法背后的许多概念。我慎重地选择了 “近似人脑功能 “这几个字,因为它是一个重要的基础概念。 

所以,无论我们在预测玩家价值还是检测欺诈,无论我们是自动生成内容还是为图片贴标签。人工智能的核心是一个训练有素的模型,它将输以一个数学 “函数”映射到输出。

用简单的数学术语来说,函数可以被认为是: “一台机器有一个输入和一个输出,而该输出与该输入相关”——数学符号以f(x)表示。当任何给定的输入(s)总是返回相同的输出时,这个函数就被认为是纯粹的。

我们训练这样的机器(模型)并衡量它们的性能,在输入模型以前从未见过的新数据时,将准确预测能力的误差最小化。

机器学习的动机:以音乐类比

与学习任何新学科一样,机器学习需要时间,而且是一个持续的过程。如果你学过一种乐器,让我们用吉他来做比喻,你会针对指弹、和弦、音阶、琶音……等进行练习。 

投入练习的动力并不是来自于练习音阶或琶音的快乐,而是来自于想把一首喜欢的歌曲从头弹到尾而不犯错的欲望。 

当你进入机器学习时,请记住这一点。你必须理解一些数学概念:微积分、概率、代数、统计。我在大学学习数学已经很多年了,而我最不愿意的就是重温数学课。我发现,就像学习乐器一样,学习的动力主要来自于好奇心,以及自己想解决具体业务问题的动机。

与任何奋力学习的过程一样,寻找一位导师永远都是明智选择。

就像学习乐器一样,从决定你要解决什么问题开始,并将问题本质的理解分化成一个一个细节部份。通常情况下,对人类来说很容易解决的问题,对计算机来说却更具挑战性。然而,人工智能已经有了长足的进步,有大量的机器学习算法以及在线代码实例,即使是新手工程师也可以探索。虽然学习ML(机器学习)的在线资源很多,但我鼓励你找一位导师。和任何学习工作一样,导师是很有价值的,尤其是在克服自我怀疑,以及帮助你在遇到时掌握新概念方面。 

你想解决什么问题?也许是一个商业案例?

问题1 

我需要解决的第一个问题与我在SEO方面的工作有关,特别是扩大链接推广的规模。在已经优化了大部分的推广管道后,我在美国体育的大型链接推广上会遇到挑战。我需要一种程序化的方式来可靠地区分”足球(美国)”以及 “足球(国际)”。 

回过头来看,这是一个琐碎的问题,但在当时,它为我提供了动力,让我探索足以解决这个问题的机器学习。一旦我学会了准备训练数据、训练模型和测量准确率的端到端流程,我很快就开始着手解决一个新的问题,并具备足够的理论来理解概念,也有足够的编码技能来实现一个可行的解决方案。 

问题2

我想用机器学习解决的下一个问题与另一个常见的SEO/链接建设问题有关,这个问题,是一个机构在大规模交付链接建设项目时遇到的:如何衡量包含链接的页面与目标页面之间的相关性。

这一直是一个主观的、基于意见的观点。任何从事过SEO链接建设的人都会知道,相关性可能相当随机,主要取决于个人意见。 

鉴于对质量保证来说,这是一个如此重要的步骤,解决方案必须很强大。在人类执行相同任务相比,准确性需理想性地有所提高。这个问题的机器学习解决方案其实很有说服力,因为它完全消除了人类的主观性。 

这个解决方案迫使我学习了许多概念,包括距离的数学表示。

问题3

随着自己对机器学习概念林林总总的发展,你会开始考虑更复杂的近似函数方法,比如使用谷歌的TensorFlow进行 “深度学习”。深度学习不是我在这篇介绍性文章中要触及的话题,但我将在接下来的几周内结合一个实际的例子来介绍这个问题。

我的下一个目标是自动生成能够在谷歌中排名前列的一致性文本,而不被识别为883个赌场的重复内容。为了解决这个问题,我不得不探索神经网络,以及使用谷歌流行的深度学习库TensorFlow进行深度学习。

为一个赌场代理网站解决这个迷人的问题,再一次迫使我跳出了之前的舒适区,走上了更陡峭的学习曲线。它不仅要求我探索新的概念,还要求我对新技术进行熟悉。

那么我们学到了什么?

我认为把注意力集中在目标、商业案例甚至是有趣的挑战上是很重要的。 

保持专注于 “为什么 “而不是 “如何”,这可能是我在过去六年探索机器学习时学到的最有价值的一课。在接下来的几周里,我将详细分解解决上述机器学习问题的步骤,以及分享一些我一路上犯的小学生错误,以便你能避免这些错误。

对于任何希望探索人工智能,或可能考虑实施人工智能的人们来说,重要的是,要把正在进行的做法视为一系列渐进式的业务流程优化。找到并隔离潜在的快速见效方法,如重复性的人类任务。考虑哪些可以轻松地自动化,什么数据是可用的,何者为当前任务的具体标准/行动,以评估风险并了解成功的衡量标准是什么样子的。 

你永远不会知道,在自身业务中探索人工智能,甚至可能会使商业分析师、项目经理与软件工程师更加紧密地联系在一起,从此过上幸福的生活。

Paul AGS

SiGMA议程:

SiGMA集团美洲数字峰会于2020年9月22至24日,将拉丁美洲博弈与科技领域的熟面孔带入深度辩论小组中,内容将以西班牙文、葡萄牙文以及英文呈现。

第7届的SiGMA欧洲将推迟到原定于11月举办的活动至2021年2月16日至18日。

为您推荐