UDN-企业互联网技术人气社区
UDN 企业互联网技术社区 U视野 如何在“机器学习”技术上获取客户...

如何在“机器学习”技术上获取客户...

TOMASZ TUNGUZ    拓扑社 2017-5-5 11:44
分享到:
摘要: 几乎每一家公司都在存储数据上面临各种挑战。但是,以机器学习为重点的初创公司所面临的挑战远不止这一点,他们还需要面临「概率」带给他们的信任危机。 ...
0CAT5XK61.jpg



  信任在软件行业真的再重要不过了,一旦信任出现了的动摇,那么用户或者买家立刻掉头走人,一秒钟都不会犹豫。

  「这个软件有些时候连我的都存储不下来」;「这个数据库三天两头的崩溃」;「这家网站频繁地宕机」,任何一句抱怨的话就会直接将你和你的产品送入深渊。

  几乎每一家公司都在存储数据上面临各种挑战。但是,以机器学习为重点的初创公司所面临的挑战远不止这一点,他们还需要面临「概率」带给他们的信任危机。

  Nate Silver 曾利用机器学习,成功预测了奥巴马在 2008 年选举上的大获全胜,在各个选区里的预测正确率都近乎 100%,这也让概率论再次站在世人面前大放异彩。原来真实世界的运行跟学院派的概率论是能对接得上的啊。

  而 8 年之后的今天,我们新总统的诞生,却出现在了机器预判之外。在 2008 年的分析和 2016 年的两次机器分析当中,数学上的推演是正确的,理论也是一脉相承的。但在 2008 年,曾经让我们产生了对数据的信赖,而在 2016 年,现实却反戈一击,这其实就是人性使然。

  很多机器学习系统同样也依赖于概率。一个程序员将一个「阀值」编译进了机器学习模型中。这个系统会利用这个「阀值」去决定目前的这个概率是否足以让我们得出结论。有些时候,它也被称之为「信心指数」。

  无论是「阀值」,还是「信心指数」,其实都代表着某件事实成立的最低标准,只有迈过这个门槛,才能得出一个结论。

  比如如果要确认它是张图片,至少「最小概率(minimum probability) 是这里面有一只猫;而「sacre blue」这个词的「信心指数」应该是将它翻译成「我的天呐」,而不是按照字面意思来说:「神圣的蓝色」。

  在系统得出结论,给出推荐之前,这个标准成立的可能性(概率)要达到多少?80%?90%?95?

  这个最小概率如果门槛太低,那么就会出现「1 型错误」,也就是「误报」;如果最小概率的门槛拉得太高,那么会带来「漏报」,也就是计算机领域中的「漏报」,也就是「2 型错误」

  机器学习领域的 SaaS 公司必须从中拿捏其平衡,不能太紧,也不能太松。如果一个产品向一端太过倾斜,那么产品就会失去用户的信任,最终毁掉一家公司。

  那么如何去应对「用户有可能对你的产品失去信任」这个风险呢?目前「聊天机器人」(chatbot)的涌现,让我在人机互动方面得出了一个原则:正确地引导,塑造用户对一个系统能力的期待值,这是至关重要的。更准确地说,少承诺一点东西,多实现一些价值,让用户处于时常获得惊喜的状态中,这就大大降低了此类风险。

  除此之外,如果说还要做什么来降低风险的话,你必须清楚你的机器如果犯错,会在哪方面出错,其性质有多严重,用户在意的是什么。机器有可能把一些无关的信息推送给用户,这是错误 1;机器把用户妈妈发来的邮件给标记成为了垃圾邮件,这是错误 2,很明显这两种错误的严重性不在一个水平线上。

  下一代机器学习产品,其关键就落在了谁能最快地获得用户信任上面。而在「提示错误」、「屏蔽邮件」、「翻译词语」、「识别图片」等工作上面,产品必须自身决定临界概率的大小到了多少,才能得出结论。

 作者丨TOMASZ TUNGUZ

  编译丨拓扑社 原野

相关阅读

分享到:
已有1条评论

最新评论

心如善水
学习

一周焦点

    关注我们:
    关于我们
    联系我们
    • 电话:010-86393388
    • 邮件:udn@yonyou.com
    • 地址:北京市海淀区北清路68号
    移动客户端下载
    关注我们
    • 微信公众号:yonyouudn
    • 扫描右侧二维码关注我们
    • 专注企业互联网的技术社区
    版权所有:用友网络科技股份有限公司82041 京ICP备05007539号-11 京公网网备安1101080209224 Powered by Discuz!
    返回顶部