UML软件工程组织

ADO.NET 2.0中的DataSet和DataTable
作者:John Papa

MSDN2005年11月刊登载了John Papa的一篇文章《DataSet and DataTable in ADO.NET 2.0》,详细介绍了ADO.Net 2.0的一些新功能和特性,对于利用ADO.NET开发的程序员来说,是值得关注的。现介绍如下:
 

一.功能增强的DataTable

在ADO.NET1.x中,DataSet完全掩盖了DataTable的光芒,并非DataTable自身功能不够强大,实则是比较DataSet而言,很多功能在1.x版本中受到了限制。例如Merge功能,在ADO.NET1.x版本中,如果要合并两个表,只有是通过DataSet的Merge方法,才能完成,代码如下:

string sqlAllCustomers = "SELECT * FROM Customers";
string cnStr = @"Data Source=.;Initial Catalog=northwind;Integrated Security=True";

 

using (SqlConnection cn = new SqlConnection(cnStr))
{
    cn.Open();
    SqlCommand cmd = new SqlCommand(sqlAllCustomers, cn);
    SqlDataAdapter adpt = new SqlDataAdapter(cmd);
    DataTable dtCust1 = new DataTable("Customers");
    adpt.Fill(dtCust1);
    dtCust1.PrimaryKey = new DataColumn[]{dtCust1.Columns["CustomerID"]};
 

    DataTable dtCust2 = dtCust1.Clone();
    DataRow row1 = dtCust2.NewRow();
    row1["CustomerID"] = "ALFKI";
    row1["CompanyName"] = "Some Company";
    dtCust2.Rows.Add(row1);

    DataRow row2 = dtCust2.NewRow();
    row2["CustomerID"] = "FOO";
    row2["CompanyName"] = "Some Other Company";
    dtCust2.Rows.Add(row2);

    DataSet ds = new DataSet("MySillyDataSet");
    ds.Tables.Add(dtCust1);
    ds.Merge(dtCust2);

    dgTest.DataSource = dtCust1;
}

在ADO.NET 2.0中,对DataTable作了改进,同样提供了Merge方法。因此如上的代码中,如果要合并表dtCust1和dtCust2,就不必再引入DataSet对象了:

dtCust1.Merge(dtCust2);

此外,ADO.NET1.x版本中,DataTable也无法完成Xml文件和数据表之间的转换。这个问题在2.0版本中,也得到了改进,DataTable也具备了和DataSet对象同样的操作xml文件的能力,包括方法ReadXml,WriteXml等。

DataSet和DataTable在2.0版本中,还提供了一个新的属性RemotingFormat。在对DataTable和DataSet对象进行序列化时,该属性标示序列化的格式是二进制还是xml。
 

二.轻量级对象和快速遍历

ADO.NET 2.0中的DataTable提供了CreateDataReader方法(在之前的版本名为GetDataReader),该方法将创建一个DataTableReader对象。DataTableReader与DataTable不同,它是一个轻量级的对象,其支持Disconnected,这一点与DataReader(SqlDataReader)不同。这些特点决定遍历DataTableReader对象将更加快速,占用的数据资源更少(Disconnected)。下面的代码创建了一个DataTableReader对象,并将其绑定到DataGridView控件上:

using (SqlConnection cn = new SqlConnection(cnStr))
{
    SqlCommand cmd = new SqlCommand(sqlAllCustomers, cn);
    SqlDataAdapter adpt = new SqlDataAdapter(cmd);
    DataTable dtCustomers = new DataTable("Customers");
    adpt.Fill(dtCustomers);
    DataTableReader dtRdr = ds.CreateDataReader();
    dgvCustomers.DataSource = dtRdr;
}

和DataReader一样,DataTableReader对象只能向前遍历,可以通过Read方法,定位到对象的第一行。如果DataTableReader如果是被一个包含有多个数据表的DataSet对象创建,DataTableReader也会包含多个结果集。通过调用NextResult方法,访问结果集序列。

using (SqlConnection cn = new SqlConnection(cnStr))
{
    // Create the Command and Adapter
    SqlCommand cmd = new SqlCommand(sqlAllCustomers, cn);
    SqlDataAdapter adpt = new SqlDataAdapter(cmd);

    // Create a DataTable and fill it
    DataTable dtCustomers = new DataTable("Customers");
    adpt.Fill(dtCustomers);

    DataSet ds = new DataSet();
    ds.Tables.Add(dtCustomers);
    adpt.SelectCommand = new SqlCommand("SELECT * FROM Orders", cn);
    adpt.Fill(ds, "Orders");

    // Create the DataTableReader (it is disconnected)
    using(DataTableReader dtRdr = ds.CreateDataReader())
    {
        do
        {
            Console.WriteLine("******************************");
            while (dtRdr.Read())
            {
                Console.WriteLine(dtRdr.GetValue(0).ToString());
            }
        }
        while (dtRdr.NextResult());
    }
}

DataTableReader对象中数据表的顺序与DataSet中的数据表顺序一致。如果你需要制定特定的顺序,可以通过重载CreateDataReader方法来实现。

三.装载数据

可以通过DataTableReader对象生成DataTable和DataSet。利用DataTable和DataSet在2.0版本中新引入的方法Load,可以传递DataTableReader或者任何实现IDataReader接口的类对象。下面的代码就是通过Load方法将dt1的数据传递到新的数据表dt2中:

DataTableReader dtRdr = dt1.CreateDataReader();
DataTable dt2 = new DataTable();
dt2.Load(dtRdr);

在使用Load方法装载多行数据时,可以先调用BeginLoadData方法来避免通知(notifications),索引维护(index maintenance)以及约束检查(constraint checking),然后再通过EndLoadData方法返回数据。

四.性能改进

这恐怕是ADO.NET 2.0最激动人心的改进。在1.x版本中,随着数据的增大,在使用DataTable和DataSet对象时,性能是不能令人满意的。ADO.NET 2.0对索引引擎作了很大的改进,使得2.0的数据访问能力获得极大的提高。以下面的测试代码为例:

DataTable dt = new DataTable("foo");
DataColumn pkCol = new DataColumn("ID", Type.GetType("System.Int32"));
pkCol.AutoIncrement = true;
pkCol.AutoIncrementSeed = 1;
pkCol.AutoIncrementStep = 1;
dt.Columns.Add(pkCol);
dt.PrimaryKey = new DataColumn[] { pkCol };
dt.Columns.Add("SomeNumber", Type.GetType("System.Int32"));
dt.Columns["SomeNumber"].Unique = true;

int limit = 1000000;
int someNumber = limit;
DateTime startTime = DateTime.Now;
for (int i = 1; i <= limit; i++)
{
    DataRow row = dt.NewRow();
    row["SomeNumber"] = someNumber—;
    dt.Rows.Add(row);
}

TimeSpan elapsedTime = DateTime.Now - startTime;
MessageBox.Show(dt.Rows.Count.ToString() + " rows loaded in " + elapsedTime.TotalSeconds + " seconds.");

分别在Visual Studio.NET 2003和Visual Studio 2005环境下运行,结果比较如下:

 

Iterations

ADO.NET 1.1

ADO.NET 2.0

10,000

0.20

0.20

100,000

7.91

3.89

1,000,000

1831.01

23.78

 

版权所有:UML软件工程组织