大数据_淮安站长网

7 款顶级开源 BI（商务智能）软件和报表工具

所属栏目：[大数据] 日期：2021-01-25 热度：50

在这个信息化时代，每分每秒都产生海量数据。在海量数据中，挖掘出有用的数据，并且能以较人性化、直观的方式展示这些数据，变得尤为重要。本文将介绍 7款顶级开源 BI（商务智能）软件和报表工具，用于商业数据的分析处理，希望对您有所帮助。 BIRT BIRT(B[详细]
数据处理之—reshape2

所属栏目：[大数据] 日期：2021-01-25 热度：117

reshape2是用来做数据处理的拓展包，它可以用来实现宽格式数据与长格式数据之间的互转。如果你熟悉结构化数据库查询，那你一定知道列转行与行转列，我这里所说的宽长数据之间互转与之类似；如果你不熟悉的也没关系，它很简单，接着往下看你就能很快熟悉并[详细]
UVA 11582 巨大数的斐波那契数列 (大数取模，幂取模，模的计算方

所属栏目：[大数据] 日期：2021-01-25 热度：57

Problem F: Colossal Fibonacci Numbers! The?i'th Fibonacci number?f?(i)?is recursively defined in the following way: f?(0) = 0?and?f?(1) = 1 f?(i+2) = f?(i+1) + f?(i)??for every?i?≥?0 Your task is to compute some values of this sequence.[详细]
【1】文本挖掘的主要概念

所属栏目：[大数据] 日期：2021-01-24 热度：142

转自 NLP论坛 http://www.threedweb.cn/thread-1281-1-1.html 什么是文本挖掘文本挖掘可以广义地定义知识密集的处理过程，其中用户使用一套分析工具与文档集合动态（随着时间的推移）交互。在类似于数据挖掘的方式，文本挖掘旨在通过识别令人感兴趣的模式[详细]
【3】文本挖掘方法论

所属栏目：[大数据] 日期：2021-01-24 热度：99

副标题#e# 转自 NLP论坛 http://www.threedweb.cn/thread-1284-1-1.html http://www.threedweb.cn/thread-1285-1-1.html http://www.threedweb.cn/thread-1286-1-1.html 文本挖掘流程第1阶段：确定研究目的像任何其他项目一样，文本挖掘的研究开始于研究[详细]
【4】构建基于scikit-learn的文本挖掘学习系统

所属栏目：[大数据] 日期：2021-01-24 热度：79

转自 NLP论坛 http://www.threedweb.cn/thread-1293-1-1.html 配置开发环境构建基于scikit-learn的文本挖掘学习系统 1. 下载和安装 python-2.7.8 for win322. 下载和安装 numpy-1.9.0-win32-superpack-python2.73. 下载和安装 scipy-0.14.0-win32-superpa[详细]
大数的四则运算

所属栏目：[大数据] 日期：2021-01-24 热度：137

项目名称：《大数的四则运算》 ? 开发环境：windows、vs2013 ? 开发技术：string、c++? ? 项目描述： ● 大数计算的底层采用string存储，将整形数据转换成字符串进行存储和运算? ● 运算的加减采用逐位加减，设置标记位，标记每一次加减的进位与借位，每[详细]
未来的信息化，就是挖掘企业数据、提升战略决策

所属栏目：[大数据] 日期：2021-01-24 热度：177

企业的发展，离不开信息化的支撑。不少企业在推进信息化进程过程中，会遇到这样的问题：开发效率低；业务需求多样且紧迫、系统多，开发人员学习困难。久而久之就会形成企业的信息数据壁垒，领导不能及时查看企业运营状况。那么该如何解决这类问题呢? 这[详细]
都想搞个大数据挖掘更多创造数据的渠道更重要

所属栏目：[大数据] 日期：2021-01-24 热度：75

点击上方蓝色字体关注。您还可以搜索公众号“ D1net”选择关注D1net旗下的各领域（云计算，数据中心，大数据，CIO，企业协作，网络数通，信息安全，企业移动应用，系统集成，服务器，存储，呼叫中心，视频会议，视频监控等）的子公众号。 ======= 现在大[详细]
bi-platform branch2.0.0问题汇总（持续更新）

所属栏目：[大数据] 日期：2021-01-24 热度：155

问题1: 缺少SecurityFilter.java 解决: com.baidu.rigel.biplatform.queryrouter.handle.manager.security下添加此类，具体文件可在QQ共享中寻找（ QQ149225568 ）问题2: QueryHandlerBuilder.java报错解决: 缺少Druid相关的内容，可以将其注释掉 maven[详细]
lightoj1370——Bi-shoe and Phi-shoe（欧拉函数应用）

所属栏目：[大数据] 日期：2021-01-24 热度：125

Description Bamboo Pole-vault is a massively popular sport in Xzhiland. And Master Phi-shoe is a very popular coach for his success. He needs some bamboos for his students,so he asked his assistant Bi-Shoe to go to the market and buy the[详细]
数据处理之——data.table

所属栏目：[大数据] 日期：2021-01-19 热度：53

副标题#e# data.table简介关于 R 中的数据处理，我们接着介绍 data.table 包。上期我们介绍的 dplyr 有类似于sql的一套数据处理的语法，而 data.table 则有着它自己的一套语法，它能处理几乎所有 dplyr 可以处理的数据，而且代码量更少，效率更高，特别是[详细]
视音频数据处理入门：H.264视频码流解析

所属栏目：[大数据] 日期：2021-01-19 热度：93

===================================================== 视音频数据处理入门系列文章：视音频数据处理入门：RGB、YUV像素数据处理视音频数据处理入门：PCM音频采样数据处理视音频数据处理入门：H.264视频码流解析视音频数据处理入门：AAC音频码流解析[详细]
连续属性离散化

所属栏目：[大数据] 日期：2021-01-19 热度：50

1. 离散化技术分类连续属性的离散化方法也可以被称为分箱法，即将一组连续的值根据一定的规则分别放到其术语的集合中。离散化技术可以根据如何对数据进行离散化加以分类，可以根据是否使用类信息或根据进行方向(即自顶向下或自底向上)分类。如果离散化[详细]
开源ETL工具kettle系列之建立缓慢增长维

所属栏目：[大数据] 日期：2021-01-19 热度：94

副标题#e# 摘要本文主要介绍使用kettle 来建立一个Type 2的Slowly Changing Dimension 以及其中一些细节问题 Kettle 简介 Kettle 是一个强大的，元数据驱动的ETL工具被设计用来填补商业和IT之前的差距，将你公司的数据变成可增长的利润. 我们先来看看Kettl[详细]
hdu1042 N!(大数)

所属栏目：[大数据] 日期：2021-01-19 热度：177

N! Time Limit: 10000/5000 MS (Java/Others)????Memory Limit: 262144/262144 K (Java/Others) Total Submission(s): 75069????Accepted Submission(s): 21870 Problem Description Given an integer N(0 ≤ N ≤ 10000),your task is to calculate N! ?[详细]
桑文锋:深入浅出大数据分析(PPT)

所属栏目：[大数据] 日期：2021-01-19 热度：108

导读在DTCC 2016中国数据库技术大会“大数据创业”专场，Sensors Data CEO 桑文锋分享了主题为《深入浅出大数据分析》的演讲，作为一名资深大数据牛人，从大数据思维讲起，深入浅出剖析数据驱动的理念，常用的数据分析方法，推荐的思路，多维数据分析技术[详细]
开源大数据查询分析引擎现状

所属栏目：[大数据] 日期：2021-01-18 热度：143

文|叶蓬【按：此文是与我的《基于大数据分析的安全管理平台技术研究及应用》同期发表在内刊上的我的同事们的作品，转载于此。这些基础性的研究和测试对比分析，对于我们的BDSA技术路线选定大有帮助。】引言大数据查询分析是云计算中核心问题之一，自从G[详细]
【数位DP】HDU3565-Bi-peak Number

所属栏目：[大数据] 日期：2021-01-18 热度：134

题目链接：http://acm.split.hdu.edu.cn/showproblem.php?pid=3565 Problem Description A peak number is defined as continuous digits {D0,D1 … Dn-1} (D0 0 and n = 3),which exist Dm (0 m n - 1) satisfied Di-1 Di (0 i = m) and Di Di+1 (m = i n[详细]
LightOJ1282 Leading and Trailing 大数取首尾

所属栏目：[大数据] 日期：2021-01-18 热度：145

任何一个数都可以转换为10^k，k是一个小数，k的整数部分决定了这个数的位数，小数部分决定了每一位的值，根据此可以快速找到前三位。通过快速幂取模可以快速找到后三位。题目链接：http://acm.hust.edu.cn/vjudge/problem/26992 #pragma comment(linker,[详细]
日均请求量百亿级数据处理平台的容器云实践

所属栏目：[大数据] 日期：2021-01-18 热度：60

from:?http://geek.csdn.net/news/detail/97887 声明：本文为CSDN原创投稿文章，未经许可，禁止任何形式的转载。? 作者：袁晓沛，目前在七牛云的主要工作是基于容器平台构建分布式应用，借助容器的优势，实现大规模分布式应用的自动化运维以及高可用，以Pa[详细]
如何计算文档相似性

所属栏目：[大数据] 日期：2021-01-18 热度：80

最近课题需要，整理一下文档相似性的一些研究，主要是参考知乎上面的回答和52nlp的相关文章。以备后期综述使用。具体还需要好好细读链接。主要思路 01/one hot representation，BOW+tf-idf+LSI/LDA体系. docsim方法：gensim包，使用corpora.Dictionary(te[详细]
关联规则挖掘——Apriori算法

所属栏目：[大数据] 日期：2021-01-18 热度：149

前言大二的时候，一个老师为了勾起我们对数据挖掘的兴趣，老是问我们这个问题：你们知道超市为什么要把啤酒跟尿布放在一起吗？但是从来没告诉我们答案。现在，很多人都听过这个问题，觉得很平常，但是那时的我真觉得挺神奇的。直到后来，了解了关联规则挖[详细]
在「不稀缺」的商业世界，如何挖掘稀缺的资源？

所属栏目：[大数据] 日期：2021-01-18 热度：114

副标题#e# 要生存壮大，就要找到新的稀缺资源，并且想尽办法掌握在自己手中。文 | 曲凯编者按：本文来源42章经（ID：MyFortyTwo），一家生产原创优质内容的科技媒体，誓同有趣、有料、有企图心的灵魂共成长。 “Technology increases access to what is[详细]
序列模式挖掘——GSP算法

所属栏目：[大数据] 日期：2021-01-18 热度：153

序列模式挖掘的基本概念项目全集I、项集X和事务集合T的概念和文章关联规则挖掘——Apriori算法中定义的一致。一个序列(Sequence)是一个有序的项集列表，这个有序通常是指时间有序。我们将序列s表示为： a1a2...ar 其中， ai 是一个项集，也称为s的一个元[详细]

2546

首页

尾页