解析XML与面向Web的数据挖掘技术 |
Web上有海量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术的最重要的应用。相对于Web的数据而言,传统的数据库中的数据结构性很强,即其中的数据为完全结构化的数据,而Web上的数据最大特点就是半结构化。所谓半结构化是相对于完全结构化的传统数据库的数据而言。显然,面向Web的数据挖掘比面向单个数据仓库的数据挖掘要复杂得多。
(02/18/2007 23:29:17,227) [查看全文] |
xml中的空格之完全解说 |
根据xml规范的规定,所谓空格是四种字符的任意组合序列: ----------------------- 空格字符(space),对应字符值为 #x20 返回字符(Carriage Return),对应字符值为 #xD 新行字符(Newline),对应字符值为 #xA 跳格字符(Tab),对应字符值为 #x9。
xml文件的空格也会形成结点,也就是空格结点。空格结点属于文字结点类型。
对xml(02/18/2007 23:28:49,386) [查看全文] |
把数据转换成XML格式的好处 |
我们常常会碰到需要处理以各种格式(从以逗号或者制表符做分隔符的文件到更负载的格式)保存或者传输的数据的情况,对每一种格式你都需要对应的解析器(parser)。这一缺点减缓了开发进度,而且可能会导致错误的发生。一个解决方案就是把常用格式的数据转化成XML文档,然后对它进行保存、处理或者转换成其它格式。
一个实例
现在已经有好多种实现在软件内部或者软件之间进行数据保存、导出、导入以及传输功能的数据格式。最常见的是定界格式(delimited(02/18/2007 23:27:59,280) [查看全文] |
Web设计中如何使用XML数据源对象 |
XML数据源对象是一个ActiveX控件,允许你在XML文件和HTML页面之间操作数据。本文将向你展示如何从各种XML数据源中提取数据,以及如何使用JavaScript显示这些数据。
XML数据源对象DSO是一个微软ActiveX控件,构建在微软IE4以后的版本上。这个对象允许你把一个外部的XML文件或者嵌入HTML文件中的内容提取到HTML页面中。
你可以在一个Web页面中使用XML - DSO从一个外部XML文件中选(02/18/2007 23:27:06,255) [查看全文] |
XML基本规则 |
1. XML 文档必须包含在一个单一元素中 2. XML 元素不能重叠,必须正确的嵌套 3. 不能省去任何结束标记,或者说标记必须成对 4. XML 元素是区分大小写的,也就是大小写敏感 5. XML 文档中的属性有两个规则: 属性必须有值 那些值必须用引号括起,可以使用单引号,也可以使用双引号,但要始终保持一致 6.(02/18/2007 23:26:41,316) [查看全文] |
使用XML的五种场合 |
1、数据交换 用XML在应用程序和公司之间作数据交换已不是什么秘密了,毫无疑问应被列为第一位。 那么为什么XML在这个领域里的地位这么重要呢?原因就是XML使用元素和属性来描述数 据。在数据传送过程中,XML始终保留了诸如父/子关系这样的数据结构。几个应用程序 可以共享和解析同一个XML文件,不必使用传统的字符串解析或拆解过程。 相反,普通文件不对每个数据段做描述(除了在头文件中),也不保留数据关系结构。使(02/18/2007 23:25:03,322) [查看全文] |
XML轻松学习手册 |
转自:动态网制作指南 www.knowsky.com 前言
XML越来越热,关于XML的基础教程网络上也随处可见。可是一大堆的概念和术语往往让人望而生畏,很多朋友问我:XML到底有什么用,我们是否需要学习它?我想就我个人学习过程的心得和经验,写一篇比较全面的介绍文章。首先有两点是需要肯定的:
第一:XML肯定是未来的发展趋势,不论是网页设计师还是网络程序员,都应该及时学习和了解,等待只会让你(02/18/2007 23:23:02,466) [查看全文] |
XML的四种解析器原理及性能比较 |
DOM是基于平台、语言无关的官方W3C标准。基于树的层次,其优点是可以移植,编程容易,开发人员只需要调用建树的指令。其缺点是加载大文件不理想。 SAX是基于事件模型的,它在解析 XML 文档的时候可以触发一系列的事件,当发现给定的tag的时候,它可以激活一个回调方法,告诉该方法制定的标签已经找到。类似与流媒体的解析方式,所以在加载大文件时效果不错。 JDOM是想成为 Java 特定文档模型。它简化与 XML 的交互并且比使用 DOM 实现更快。使用的是具体类不使用接口,运用了大量的COll(02/18/2007 20:58:38,386) [查看全文] |
shtml精简教程 |
SSI有什么用? 之所以要扯到ssi,是因爲shtml--server-parsed HTML 的首字母缩略词。包含有嵌入式服务器方包含命令的 HTML 文本。在被传送给浏览器之前,服务器会对 SHTML 文档进行完全地读取、分析以及修改。 shtml和asp 有一些相似,以shtml命名的文件里,使用了ssi的一些指令,就像asp中的指令,你可以在SHTML文件中写入SSI指令,当客户端访问这些shtml文件时, 服务器(02/18/2007 20:57:18,229) [查看全文] |
在IE中调用javascript打开Excel |
(downmoon原作)关键词: javascript调用exc (02/18/2007 20:56:28,580) [查看全文] |
端口大全及端口关闭方法 |
一 、端口大全 端口:0 服务:Reserved 说明:通常用于分析操作系统。这一方法能够工作是因为在一些系统中“0”是无效端口,当你试图使用通常的闭合端口连接它时将产生不同的结果。一种典型的扫描,使用IP地址为0.0.0.0,设置ACK位并在以太网层广播。 端口:1 服务:tcpmux 说明:这显示有人在寻找SGI Irix机器。Irix是实现tcpmux的主要提供者,默认情况下tcpmux在这种系统中被打开。Ir(02/18/2007 20:46:33,247) [查看全文] |
大型企业门户网站设计开发一般性原则和建议 |
[适用范围] 本文所述的原则、建议适用于大型企业信息门户网站的设计和开发,注意不是小型企业网站、一般企业电子商务网站、企业级Web应用系统。
[一般性原则] 一、网站设计原则 第一原则:内容丰富、明确 网站主要是为浏览着提供信息服务的,作为大型企业信息门户网站,必须首先提供种类繁多内容丰富的(02/18/2007 20:22:15,423) [查看全文] |
百度搜索引擎对SEO元素的比重研究 |
按100分算
标题: 100
外部链接:90
域名: 80
H1 H2 字号标题:70
相似度(关键词堆积):65
文章首句: 60
路径或文件名:50
Meta描述(Description):10
Meta关键词(Keywords):10
alt标记:10
加粗或斜体:5
(02/17/2007 15:13:28,255) [查看全文] |
新手学堂:对付DDoS攻击的几大妙招虚拟主机IIS防范入侵十个常见问题解答 |
1.如何让asp脚本以system权限运行?
修改你asp脚本所对应的虚拟目录,把"应用程序保护"修改为"低"。
2.如何防止asp木马?
基于FileSystemObject组件的asp木马
cacls %systemroot%\system32\scrrun.dll /e /d guests //禁止guests使用
regsvr32 scrrun.dll /u /s //删除
基(02/17/2007 12:04:01,1165) [查看全文] |
Web服务器IIS6的PHP最佳配置方法 |
IIS6的PHP最佳配置方法
本文收藏自网络,本人还没有试过,不知如何,现在PHP版本已经到了5.2了。读者应该找找新的文章,本人自已搭建了一个Apache+PHP+Mysql+Mysqladmin平台,只用做学习用,还没真正实战过。!!!
虽然 LAMP 组合很不错,但是如果想要架设一台同时支持 PHP、ASP、ASP.NET、JSP、Perl 的 Web 虚拟主机服务器,还是用 Windows 2003 的 IIS (02/17/2007 11:34:30,243) [查看全文] |