-
7 款顶级开源 BI(商务智能)软件和报表工具
所属栏目:[大数据] 日期:2021-01-25 热度:50
在这个信息化时代,每分每秒都产生海量数据。在海量数据中,挖掘出有用的数据,并且能以较人性化、直观的方式展示这些数据,变得尤为重要。本文将介绍 7款顶级开源 BI(商务智能)软件和报表工具,用于商业数据的分析处理,希望对您有所帮助。 BIRT BIRT(B[详细]
-
数据处理之—reshape2
所属栏目:[大数据] 日期:2021-01-25 热度:117
reshape2是用来做数据处理的拓展包,它可以用来实现宽格式数据与长格式数据之间的互转。如果你熟悉结构化数据库查询,那你一定知道列转行与行转列,我这里所说的宽长数据之间互转与之类似;如果你不熟悉的也没关系,它很简单,接着往下看你就能很快熟悉并[详细]
-
UVA 11582 巨大数的斐波那契数列 (大数取模,幂取模,模的计算方
所属栏目:[大数据] 日期:2021-01-25 热度:57
Problem F: Colossal Fibonacci Numbers! The?i'th Fibonacci number?f?(i)?is recursively defined in the following way: f?(0) = 0?and?f?(1) = 1 f?(i+2) = f?(i+1) + f?(i)??for every?i?≥?0 Your task is to compute some values of this sequence.[详细]
-
【1】文本挖掘的主要概念
所属栏目:[大数据] 日期:2021-01-24 热度:142
转自 NLP论坛 http://www.threedweb.cn/thread-1281-1-1.html 什么是文本挖掘 文本挖掘可以广义地定义知识密集的处理过程,其中用户使用一套分析工具与文档集合动态(随着时间的推移)交互。在类似于数据挖掘的方式,文本挖掘旨在通过识别令人感兴趣的模式[详细]
-
【3】 文本挖掘方法论
所属栏目:[大数据] 日期:2021-01-24 热度:99
副标题#e# 转自 NLP论坛 http://www.threedweb.cn/thread-1284-1-1.html http://www.threedweb.cn/thread-1285-1-1.html http://www.threedweb.cn/thread-1286-1-1.html 文本挖掘流程 第1阶段:确定研究目的 像任何其他项目一样,文本挖掘的研究开始于研究[详细]
-
【4】构建基于scikit-learn的文本挖掘学习系统
所属栏目:[大数据] 日期:2021-01-24 热度:79
转自 NLP论坛 http://www.threedweb.cn/thread-1293-1-1.html 配置开发环境 构建基于scikit-learn的文本挖掘学习系统 1. 下载和安装 python-2.7.8 for win322. 下载和安装 numpy-1.9.0-win32-superpack-python2.73. 下载和安装 scipy-0.14.0-win32-superpa[详细]
-
大数的四则运算
所属栏目:[大数据] 日期:2021-01-24 热度:137
项目名称:《大数的四则运算》 ? 开发环境:windows、vs2013 ? 开发技术:string、c++? ? 项目描述: ● 大数计算的底层采用string存储,将整形数据转换成字符串进行存储和运算? ● 运算的加减采用逐位加减,设置标记位,标记每一次加减的进位与借位,每[详细]
-
未来的信息化,就是挖掘企业数据、提升战略决策
所属栏目:[大数据] 日期:2021-01-24 热度:177
企业的发展,离不开信息化的支撑。 不少企业在推进信息化进程过程中,会遇到这样的问题:开发效率低;业务需求多样且紧迫、系统多,开发人员学习困难。久而久之就会形成企业的信息数据壁垒,领导不能及时查看企业运营状况。 那么该如何解决这类问题呢? 这[详细]
-
都想搞个大数据 挖掘更多创造数据的渠道更重要
所属栏目:[大数据] 日期:2021-01-24 热度:75
点击上方蓝色字体关注。 您还可以搜索公众号“ D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数据,CIO,企业协作,网络数通,信息安全,企业移动应用,系统集成,服务器,存储,呼叫中心,视频会议,视频监控等)的子公众号。 ======= 现在大[详细]
-
bi-platform branch2.0.0问题汇总(持续更新)
所属栏目:[大数据] 日期:2021-01-24 热度:155
问题1: 缺少SecurityFilter.java 解决: com.baidu.rigel.biplatform.queryrouter.handle.manager.security下添加此类,具体文件可在QQ共享中寻找( QQ149225568 ) 问题2: QueryHandlerBuilder.java报错 解决: 缺少Druid相关的内容,可以将其注释掉 maven[详细]
-
lightoj1370——Bi-shoe and Phi-shoe(欧拉函数应用)
所属栏目:[大数据] 日期:2021-01-24 热度:125
Description Bamboo Pole-vault is a massively popular sport in Xzhiland. And Master Phi-shoe is a very popular coach for his success. He needs some bamboos for his students,so he asked his assistant Bi-Shoe to go to the market and buy the[详细]
-
数据处理之——data.table
所属栏目:[大数据] 日期:2021-01-19 热度:53
副标题#e# data.table简介 关于 R 中的数据处理,我们接着介绍 data.table 包。上期我们介绍的 dplyr 有类似于sql的一套数据处理的语法,而 data.table 则有着它自己的一套语法,它能处理几乎所有 dplyr 可以处理的数据,而且代码量更少,效率更高,特别是[详细]
-
视音频数据处理入门:H.264视频码流解析
所属栏目:[大数据] 日期:2021-01-19 热度:93
===================================================== 视音频数据处理入门系列文章: 视音频数据处理入门:RGB、YUV像素数据处理 视音频数据处理入门:PCM音频采样数据处理 视音频数据处理入门:H.264视频码流解析 视音频数据处理入门:AAC音频码流解析[详细]
-
连续属性离散化
所属栏目:[大数据] 日期:2021-01-19 热度:50
1. 离散化技术分类 连续属性的离散化方法也可以被称为分箱法,即将一组连续的值根据一定的规则分别放到其术语的集合中。 离散化技术可以根据如何对数据进行离散化加以分类,可以根据是否使用类信息或根据进行方向(即自顶向下或自底向上)分类。 如果离散化[详细]
-
开源ETL工具kettle系列之建立缓慢增长维
所属栏目:[大数据] 日期:2021-01-19 热度:94
副标题#e# 摘要 本文主要介绍使用kettle 来建立一个Type 2的Slowly Changing Dimension 以及其中一些细节问题 Kettle 简介 Kettle 是一个强大的,元数据驱动的ETL工具被设计用来填补商业和IT之前的差距,将你公司的数据变成可增长的利润. 我们先来看看Kettl[详细]
-
hdu1042 N!(大数)
所属栏目:[大数据] 日期:2021-01-19 热度:177
N! Time Limit: 10000/5000 MS (Java/Others)????Memory Limit: 262144/262144 K (Java/Others) Total Submission(s): 75069????Accepted Submission(s): 21870 Problem Description Given an integer N(0 ≤ N ≤ 10000),your task is to calculate N! ?[详细]
-
桑文锋:深入浅出大数据分析(PPT)
所属栏目:[大数据] 日期:2021-01-19 热度:108
导读 在DTCC 2016中国数据库技术大会“大数据创业”专场,Sensors Data CEO 桑文锋分享了主题为《深入浅出大数据分析》的演讲,作为一名资深大数据牛人,从大数据思维讲起,深入浅出剖析数据驱动的理念,常用的数据分析方法,推荐的思路,多维数据分析技术[详细]
-
开源大数据查询分析引擎现状
所属栏目:[大数据] 日期:2021-01-18 热度:143
文|叶蓬 【按:此文是与我的《基于大数据分析的安全管理平台技术研究及应用》同期发表在内刊上的我的同事们的作品,转载于此。这些基础性的研究和测试对比分析,对于我们的BDSA技术路线选定大有帮助。】 引言 大数据查询分析是云计算中核心问题之一,自从G[详细]
-
【数位DP】HDU3565-Bi-peak Number
所属栏目:[大数据] 日期:2021-01-18 热度:134
题目链接:http://acm.split.hdu.edu.cn/showproblem.php?pid=3565 Problem Description A peak number is defined as continuous digits {D0,D1 … Dn-1} (D0 0 and n = 3),which exist Dm (0 m n - 1) satisfied Di-1 Di (0 i = m) and Di Di+1 (m = i n[详细]
-
LightOJ1282 Leading and Trailing 大数取首尾
所属栏目:[大数据] 日期:2021-01-18 热度:145
任何一个数都可以转换为10^k,k是一个小数,k的整数部分决定了这个数的位数,小数部分决定了每一位的值,根据此可以快速找到前三位。 通过快速幂取模可以快速找到后三位。 题目链接:http://acm.hust.edu.cn/vjudge/problem/26992 #pragma comment(linker,[详细]
-
日均请求量百亿级数据处理平台的容器云实践
所属栏目:[大数据] 日期:2021-01-18 热度:60
from:?http://geek.csdn.net/news/detail/97887 声明:本文为CSDN原创投稿文章,未经许可,禁止任何形式的转载。? 作者:袁晓沛,目前在七牛云的主要工作是基于容器平台构建分布式应用,借助容器的优势,实现大规模分布式应用的自动化运维以及高可用,以Pa[详细]
-
如何计算文档相似性
所属栏目:[大数据] 日期:2021-01-18 热度:80
最近课题需要,整理一下文档相似性的一些研究,主要是参考知乎上面的回答和52nlp的相关文章。以备后期综述使用。具体还需要好好细读链接。 主要思路 01/one hot representation,BOW+tf-idf+LSI/LDA体系. docsim方法:gensim包,使用corpora.Dictionary(te[详细]
-
关联规则挖掘——Apriori算法
所属栏目:[大数据] 日期:2021-01-18 热度:149
前言 大二的时候,一个老师为了勾起我们对数据挖掘的兴趣,老是问我们这个问题:你们知道超市为什么要把啤酒跟尿布放在一起吗?但是从来没告诉我们答案。现在,很多人都听过这个问题,觉得很平常,但是那时的我真觉得挺神奇的。直到后来,了解了关联规则挖[详细]
-
在「不稀缺」的商业世界,如何挖掘稀缺的资源?
所属栏目:[大数据] 日期:2021-01-18 热度:114
副标题#e# 要生存壮大,就要找到新的稀缺资源, 并且想尽办法掌握在自己手中。 文 | 曲凯 编者按:本文来源42章经(ID:MyFortyTwo),一家生产原创优质内容的科技媒体,誓同有趣、有料、有企图心的灵魂共成长。 “Technology increases access to what is[详细]
-
序列模式挖掘——GSP算法
所属栏目:[大数据] 日期:2021-01-18 热度:153
序列模式挖掘的基本概念 项目全集I、项集X和事务集合T的概念和文章关联规则挖掘——Apriori算法 中定义的一致。一个序列(Sequence)是一个有序的项集列表,这个有序通常是指时间有序。我们将序列s表示为: a1a2...ar 其中, ai 是一个项集,也称为s的一个元[详细]
