现状
互联网兴起,移动智能设备广泛应用,即时性、多样性的海量数据爆发,传统数据分析经验不足以支撑单位业务的深度发展。如何利用大数据管理用好外部与内部数据,促进业务发展,成为政府与企业关注的重点。
痛点
数据单一
数据缺失
数据孤岛
难以共享
需求多样化
服务个性化
策略
01大数据应用
军犬系列应用
慧数系列应用
02大数据能力
BI
NIP
遗忘算法
高并发
数据采集
03大数据资源
超过1000亿内容数据与客户画像数据资产
大数据整合——解决数据来源
1000亿用户与内容数据,内部数据与外部
数据的高度融合
{
大数据处理
}
大数据处理
HADOOP数据分析生态平台
}
数据采集,持续解决数据来源问题
军犬1系
一键采集
军犬5系
分布式采集
军犬3系
694/860单机采集
军犬5系
分布式采集
军犬大数据一体机,单机处理50亿
数据的超级一体机,数据管理首选
- 软硬件结合
- 数据管理首选
BI商业智能,多维分析和报表展现
-
满足多变需求
支持所有报表以及定制式报表,完美满足客户对数据分析和展现的多变需求
遗忘算法——智能语义分析,建立各行业各维度词库与数据标准
大规模语料词库生成
候选词自动生成/切片算法/相邻词统计/权重排序/清理词频
分词
无监督学习/O(N)级时间复杂度/词库自维护/领域自适应/支持多语种混合分词
关键词提取
关键词抽取/自动标签生成文本摘要/相似度计算
文本相似度识别
统计单篇文章的词汇权重
大数据应用——标准化打造大数据创新应用
196个大数据平台实操作点
100天研发上线运营
流水线式开发大数据行业应用平台