DotNet · 2022年3月11日

.NET处理CSV文件 插件CSVReader

    优点:速度快,方便。

    在c#中读取csv文件可以使用OLEDB当作数据库来读取,或者一行行的读取,然后使用正则表达式进行解析。使用oledb一般情况下也比较方便,但是效率不是很好,特别是csv文件很大的情况下。如果一行行的读取,对数据字段进行拆分是个难题,一般情况下使用英文逗号就可以了,但是很多情况下字段的内容也都包含了逗号,还有可能一条数据要占用多行。今天推荐一个别人封装好的csv读取类库:CSVReader,可以快速方便的处理csv数据。

类库作者开发这个程序经历了很多年了,最近还在更新中。点击下面的地址到官方网站:
http://www.codeproject.com/KB/database/CsvReader.aspx

这个程序的最大特点是速度快,按照作者的说法比使用OLEDB正则表达式的方法大约快15倍,而且内存使用较少。举一个例子,在CPU P4 3.0 GHz, 内存1024 MB的电脑上,一个45M的csv文件,145个字段,5万条记录,用时大约1.5秒,每秒钟处理大约30M数据。当然肯定不是每次都这么快,影响的因素比较多,咱也不要较真。

这个程序还有一个特点是可以处理多行数据,前提是数据必须引用起来。

这个程序本质上也是按行读取的,在读取的时候会为当前记录保存一个字段缓存。作者还提供了一个类CachedCsvReader会将csv文件内容全部缓存到内存,然后从缓存中读取。

说了这么多,看看例子吧:
1、基本用法


using System.IO;
using LumenWorks.Framework.IO.Csv;
void ReadCsv()
{
// 打开"data.csv" ,这个csv文件应该有一个标题行
using (CsvReader csv =
new CsvReader(newStreamReader("data.csv"),true))
//中文文件的处理!!! CsvReader csv = new CsvReader(new StreamReader(fileLocation, Encoding.Default, true), true);
{
//字段数量
int fieldCount = csv.FieldCount;
//标题数组
string[] headers = csv.GetFieldHeaders();
//只进的游标读取
while (csv.ReadNextRecord())
{
//遍历列
for (inti = 0; i < fieldCount; i++)
Console.Write(string.Format("{0} = {1};",
headers[i], csv[i]));
Console.WriteLine();
}
}
}


2、简单数据绑定(ASP.NET)


using System.IO;
using LumenWorks.Framework.IO.Csv;
void ReadCsv()
{
// 打开"data.csv" ,这个csv文件应该有一个标题行
using (CsvReader csv =new CsvReader(
new StreamReader("data.csv"),true))
{
myDataRepeater.DataSource = csv;
myDataRepeater.DataBind();
}
}


对于DataGrid和GridView不能使用,原因是效率问题和控件的内部机制无法满足。具体说明看上边提供的网址。

3、复杂数据绑定(Windows Forms)


using System.IO;
using LumenWorks.Framework.IO.Csv;
void ReadCsv()
{
    // 打开"data.csv" ,这个csv文件应该有一个标题行
    using(CachedCsvReader csv = new
           CachedCsvReader(newStreamReader("data.csv"),true))
    {
        // 字段 标题将自动作为列的名称
        myDataGrid.DataSource = csv;
    }
}


4、自定义错误处理


using System.IO;
using LumenWorks.Framework.IO.Csv;
void ReadCsv()
{
    //  打开"data.csv" ,这个csv文件应该有一个标题行
    using(CsvReader csv = new CsvReader(
           newStreamReader("data.csv"),true))
    {
        // 丢失的字段将不会抛出异常,而被当作一个null值处理
        csv.MissingFieldAction = MissingFieldAction.ReplaceByNull;
        // 丢失的字段将不会抛出异常,而被当作一个null值处理
        //csv.MissingFieldAction = MissingFieldAction.ReplaceByEmpty;
        intfieldCount = csv.FieldCount;
        string[] headers = csv.GetFieldHeaders();
        while(csv.ReadNextRecord())
        {
            for(int i = 0; i < fieldCount; i++)
                Console.Write(string.Format("{0} = {1};",
                              headers[i],
                              csv[i] ==null ? "MISSING": csv[i]));
            Console.WriteLine();
        }
    }
}


5、自定义错误触发事件


using System.IO;
using LumenWorks.Framework.IO.Csv;

void ReadCsv()
{
    // open the file "data.csv" which is a CSV file with headers
    using(CsvReader csv = new CsvReader(
           newStreamReader("data.csv"),true))
    {
        // 格式化字段出错时,触发事件csv_ParseError
       csv.DefaultParseErrorAction = ParseErrorAction.RaiseEvent;
        csv.ParseError +=new ParseErrorEventHandler(csv_ParseError);
 
        intfieldCount = csv.FieldCount;
        string[] headers = csv.GetFieldHeaders();
        while(csv.ReadNextRecord())
        {
            for(int i = 0; i < fieldCount; i++)
                Console.Write(string.Format("{0} = {1};",
                              headers[i], csv[i]));
            Console.WriteLine();
        }
    }
}

void csv_ParseError(objectsender, ParseErrorEventArgs e)
{

    // 如果错误是字段不存在,则跳转到下一行
    if(e.Error is MissingFieldCsvException)
    {
        Console.Write("--MISSING FIELD ERROR OCCURRED");
        e.Action = ParseErrorAction.AdvanceToNextLine;
    }
}


使用起来还是挺方便的,赶紧试试吧。

最新电影,电视剧,尽在午夜剧场

电影电视剧午夜不寂寞