며칠전에 사석에서 상사분이 톰캣(Tomcat)은 IIS에 비해서 connection을 적게 받고, 그로 인해서 성능이 떨어진다고 말씀을 하시네요. ^^;; 서비스의 전체적인 성능 문제를 자바(Java)나 톰캣이 문제가 있다는 시각이어서, 자바쪽의 경험치로 말씀하시는게 아니라 선입견(Overlapped I/O의 성능만 말씀하시네 ^^;;)으로 얘기를 하고 있다는 느낌이 많이 받았습니다. 대체로, 서비스의 성능 이슈는 톰캣이나 IIS보다 그 위에 올라가는 애플리케이션이 더 성능에 영향을 미칠텐데 말입니다. ^^;;
그래서 IIS 기반의 ASP.NET 서비스들이 주로 사용하는 DataSet에 대해서 Serialize 데이타에 대해서 살펴보았다. 비교는 단순히 자바, C# Object, C# DataSet으로 10개의 리스트를 가지는 모델을 가지고 했다. 아래의 코드로 자바에서의 Object Array, C#에서의 Object Array, C#에서의 DataSet의 Serialize된 객체의 사이즈를 알 수 있다. 단순하게 Serialize하는 속도 및 Deserialize하는 속도는 같다고 가정을 한다.
* Java
– SerializeModel.java
import java.util.ArrayList; import java.io.Serializable; public class SerializeModel implements Serializable { private static final long serialVersionUID = -7168303693593724718L; private int count = 0; private String name = null; private String address = null; private ArrayList<SerializeModel> models = new ArrayList<SerializeModel>(); public SerializeModel(int count, String name, String address) { this.count = count; this.name = name; this.address = address; } public void addModel(SerializeModel model) { this.models.add(model); } }
– SerializeTest.java
import java.io.FileOutputStream; import java.io.ObjectOutputStream; public class SerializeTest { public static void main(String[] args) throws Exception { ObjectOutputStream out = new ObjectOutputStream(new FileOutputStream("java.ser")); SerializeModel model = new SerializeModel(0, "a", "b"); for(int i=0; i<10; i++) { model.addModel(new SerializeModel(i, i +" name", i +" address")); } out.writeObject(model); out.flush(); out.close(); } }
* C#
– SerializeModel.cs
using System; using System.IO; using System.Runtime.Serialization; using System.Collections; using System.Collections.Generic; namespace SerialzieTest { [Serializable()] class SerializeModel { private int count = 0; private String name = null; private String address = null; private ArrayList models = new ArrayList(); public SerializeModel(int count, String name, String address) { this.count = count; this.name = name; this.address = address; } public void AddModel(SerializeModel model) { this.models.Add(model); } } }
– SerializeModelDataSet.cs
using System; using System.Data; using System.Collections.Generic; using System.Text; namespace SerialzieTest { [Serializable] class SerializeModelDataSet { private DataSet dataSet = new DataSet(); public void AddDataTable(DataTable table) { this.dataSet.Tables.Add(table); } public DataSet GetDataSet() { return this.dataSet; } } }
– Program.cs
using System; using System.Data; using System.IO; using System.Runtime.Serialization; using System.Runtime.Serialization.Formatters.Binary; namespace SerialzieTest { class Program { static void SerializeObjectArray() { Stream stream = File.Open("csharp.ser", FileMode.Create); BinaryFormatter bformat = new BinaryFormatter(); SerializeModel model = new SerializeModel(0, "a", "b"); for (int i = 0; i < 10; i++) { model.AddModel(new SerializeModel(i, i + " name", i + " address")); } bformat.Serialize(stream, model); stream.Flush(); stream.Close(); } static void SerializeDataSet() { Stream stream = File.Open("csharp_dataset.ser", FileMode.Create); BinaryFormatter bformat = new BinaryFormatter(); SerializeModelDataSet model = new SerializeModelDataSet(); DataTable table = new DataTable(); DataColumn itemCount = new DataColumn("count", Type.GetType("System.Int32")); DataColumn itemName = new DataColumn("name", Type.GetType("System.String")); DataColumn itemAddress = new DataColumn("address", Type.GetType("System.String")); table.Columns.Add(itemCount);</span> table.Columns.Add(itemName); table.Columns.Add(itemAddress); DataRow row; for (int i = 0; i < 10; i++) { row = table.NewRow(); row["count"] = i; row["name"] = i + " name"; row["address"] = i + " address"; table.Rows.Add(row); } model.AddDataTable(table); bformat.Serialize(stream, model); stream.Flush(); stream.Close(); } static void Main(string[] args) { SerializeObjectArray(); SerializeDataSet(); } } }
위 코드를 사용해서 저장한 Object의 사이즈는 아래와 같습니다.
C#(Object ArrayList) : 1035 byte
C#(DataSet) : 3000 byte
네트웍으로 전송되는 데이터의 크기는 성능에 중요한 영향을 준다는 것은 이미 알고 있다. 성능을 높이기 위해서 Socket Buffer의 사이즈를 적당히 줄이는 것도 팁중의 하나이다. 그리고, 위 코드로 만들어지는 C#의 DataSet은 더욱 멋진 모습을 보여준다. 아래의 화면처럼 말이죠.. 아래의 화면은 Hex Viewer로 본 화면이다.
Object의 Serialize는 C#이 version, locale 및 가비지(?) 데이타로 인해서 좀 더 크게 나온다. 그리고, 중간의 DataSet은 Serialize된 내용을 보면, xml의 형태로 데이터를 저장하고 있다. 결국 DataSet을 데이타로 직렬화해서 네트웍으로 전송하게 되면, 데이터 크기보다는 Serialize/Deserialize할때의 String연산(XML 데이타 리드)이 성능저하의 주범이 될 것 같다. 결국, Tomcat, IIS가 중요한게 아니라 C#에서 널리 쓰이는 DataSet을 많이 사용하고 있는 IIS기반의 ASP.NET 어플들의 서비스가 더 문제가 아닐까 생각한다.