月度归档:2018年12月

认知智能到感知智能中对知识的思考

Deep Learning Specialization on Coursera

知道创宇 IA实验室

尽管人工智能依靠深度学习和机器学习技术的进步取得了巨大的进展,例如,AlphaGo通过自我强化学习击败了人类顶尖的围棋选手,但人工智能在很多方面,如语言理解、视觉场景理解、决策分析等,仍然举步维艰。一个关键的问题就是,机器必须要掌握大量的知识,特别是常识知识才能实现真正类人的智能。这也说明当前随着大数据红利的消失殆尽,以深度学习为代表的感知智能水平日益接近其“天花板”,而以知识为中心的认知智能将是下一代人工智能技术的关键方向。自从谷歌收购 Freebase 在 2012 年推出知识图谱(Knowledge Graph)后,知识图谱在知识工程、专家系统、逻辑推理的人工智能技术上受到了推崇,行业巨头和创业公司都在建立与自己行业相关的行业知识图谱。

本文将结合认知心理学来谈谈知识与认知智能的一些思考,试着理清

  • 知识与数据、信息、智慧的关系;
  • 认知智能为什么依赖知识?

继续阅读

加速机器学习:从主动学习到BERT和流体标注

Deep Learning Specialization on Coursera

知道创宇IA-Lab  岳永鹏

机器学习模型代码优化是为了获得更高效(时间更少、存储更少、计算规模更大)执行的机器指令和具有更强泛化能力的模型,获得更高效执行的机器指令可以采用多核和高频的CPU计算,以及采用并行计算和向量化计算。而获得具有更强泛化能力的模型不仅仅与选择的模型有关,还与标注数据的数量和质量有关。而数据标注需要大量标注人员从事重复而枯燥的工作,这也必然会增加成本。

本文将介绍主动学习(Active Learning)以及主动学习结合Google今年发布的流体标注(Fluid Annotation)和BERT(Bidirectional Encoder Representation from Transformers)对加速机器学习有什么启示。

继续阅读

polyglot:Pipeline 多语言NLP工具

Deep Learning Specialization on Coursera

知道创宇IA-Lab 岳永鹏

目前,在NLP任务处理中,Python支持英文处理的开源包有NLTK、Scapy、StanfordCoreNLP、GATE、OPenNLP,支持中文处理的开源工具包有Jieba、ICTCLAS、THU LAC、HIT LTP,但是这些工具大部分仅对特定类型的语言提供支持。本文将介绍功能强大的支持Pipeline方式的多语言处理Python工具包:polyglot。该项目最早是由AboSamoor在2015年3月16日在GitHub上开源的项目,已经在Github收集star 1021个。

特征

  • 语言检测 Language Detection (支持196种语言)
  • 分句、分词 Tokenization (支持165种语言)
  • 实体识别 Named Entity Recognition (支持40种语言)
  • 词性标注 Part of Speech Tagging(支持16种语言)
  • 情感分析 Sentiment(支持136种语言)
  • 词嵌入 Word Embeddings(支持137种语言)
  • 翻译 Transliteration(支持69种语言)
  • 管道 Pipelines

继续阅读

谷歌云平台上基于TensorFlow的高级机器学习专项课程

Deep Learning Specialization on Coursera

Coursera近期推了一门新专项课程:谷歌云平台上基于TensorFlow的高级机器学习专项课程(Advanced Machine Learning with TensorFlow on Google Cloud Platform Specialization),看起来很不错。这个系列包含5门子课程,涵盖端到端机器学习、生产环境机器学习系统、图像理解、面向时间序列和自然语言处理的序列模型、推荐系统等内容,感兴趣的同学可以关注:Learn Advanced Machine Learning with Google Cloud. Build production-ready machine learning models with TensorFlow on Google Cloud Platform.

课程链接:http://coursegraph.com/coursera-specializations-advanced-machine-learning-tensorflow-gcp
继续阅读