db4o开发:结构化对象的创建
来源:长沙北大青鸟|发布时间:2017-03-17|浏览量:
近期,在面向 Java 开发者的 db4o 指南中,我查看了各种使用db4o 存储Java 对象的方法,这些方法都不依赖映射文件。使用原生对象数据库的其中一个优点就是可以避免对象关系映射,但我曾用于阐述这种优点的对象模型过于简单,绝大多数企业系统要求创建并操作相当复杂的对象,也称为结构化对象,因此本文将讨论结构化对象的创建。
结构化对象,基本上可以看成是一个引用其他对象的对象。尽管 db4o 允许对结构化对象执行所有常用的 CRUD 操作,但是用户却必须承受一定的复杂性。本文将探究一些主要的复杂情况(比如无限递归、层叠行为和引用一致性),以后的文章还将深入探讨更加高级的结构化对象处理问题。作为补充,我还将介绍探察测试(exploration test):一种少为人知的可测试类库及 db4o API 的测试技术。
从简单到结构化
清单 1 重述了我在介绍 db4o 时一直使用的一个简单类 Person:
清单 1. Person
package com.tedneward.model;
public class Person
{
public Person()
{ }
public Person(String firstName, String lastName, int age, Mood mood)
{
this.firstName = firstName;
this.lastName = lastName;
this.age = age;
this.mood = mood;
}
public String getFirstName() { return firstName; }
public void setFirstName(String value) { firstName = value; }
public String getLastName() { return lastName; }
public void setLastName(String value) { lastName = value; }
public int getAge() { return age; }
public void setAge(int value) { age = value; }
public Mood getMood() { return mood; }
public void setMood(Mood value) { mood = value; }
public String toString()
{
return
"[Person: " +
"firstName = " + firstName + " " +
"lastName = " + lastName + " " +
"age = " + age + " " +
"mood = " + mood +
"]";
}
public boolean equals(Object rhs)
{
if (rhs == this)
return true;
if (!(rhs instanceof Person))
return false;
Person other = (Person)rhs;
return (this.firstName.equals(other.firstName) &&
this.lastName.equals(other.lastName) &&
this.age == other.age);
}
private String firstName;
private String lastName;
private int age;
private Mood mood;
}
OODBMS 系统中的 String
您可能还记得,在我此前的文章示例中,Person 类型使用 String 作为字段。在 Java 和 .NET 里,String 是一种对象类型,从 Object 继承而来,这似乎有些矛盾。事实上,包括 db4o 在内的绝大多数 OODBMS 系统在对待 String 上与其他对象都有不同,尤其针对 String 的不可变(immutable)特性。
这个简单的 Person 类在用于介绍基本 db4o 存储、查询和检索数据操作时行之有效,但它无法满足真实世界中企业编程的复杂性。举例而言,数据库中的 Person 有家庭地址是很正常的。有些情况下,还可能需要配偶以及子女。
若要在数据库里加一个 “Spouse” 字段,这意味着要扩展 Person,使它能够引用 Spouse 对象。假设按照某些业务规则,还需要添加一个 Gender 枚举类型及其对应的修改方法,并在构造函数里添加一个 equals() 方法。在清单 2 中,Person 类型有了配偶字段和对应的 get/set 方法对,此时还附带了某些业务规则:
清单 2. 这个人到了结婚年龄吗?
package com.tedneward.model;
public class Person {
// . . .
public Person getSpouse() { return spouse; }
public void setSpouse(Person value) {
// A few business rules
if (spouse != null)
throw new IllegalArgumentException("Already married!");
if (value.getSpouse() != null && value.getSpouse() != this)
throw new IllegalArgumentException("Already married!");
spouse = value;
// Highly sexist business rule
if (gender == Gender.FEMALE)
this.setLastName(value.getLastName());
// Make marriage reflexive, if it's not already set that way
if (value.getSpouse() != this)
value.setSpouse(this);
}
private Person spouse;
}
清单 3 中的代码创建了两个到达婚龄的 Person,代码和您预想的很接近:
import java.util.*;
import com.db4o.*;
import com.db4o.query.*;
import com.tedneward.model.*;
public class App
{
public static void main(String[] args)
throws Exception
{
ObjectContainer db = null;
try
{
db = Db4o.openFile("persons.data");
Person ben = new Person("Ben", "Galbraith",
Gender.MALE, 29, Mood.HAPPY);
Person jess = new Person("Jessica", "Smith",
Gender.FEMALE, 29, Mood.HAPPY);
ben.setSpouse(jess);
System.out.println(ben);
System.out.println(jess);
db.set(ben);
db.commit();
List<Person> maleGalbraiths =
db.query(new Predicate<Person>() {
public boolean match(Person candidate) {
return candidate.getLastName().equals("Galbraith") &&
candidate.getGender().equals(Gender.MALE);
}
});
for (Person p : maleGalbraiths)
{
System.out.println("Found " + p);
}
}
finally
{
if (db != null)
db.close();
}
}
}
除了讨厌的业务规则之外,有几个重要的情况出现了。首先,当对象 ben 存储到数据库后,OODBMS 除了存储一个对象外,显然还做了其他一些事情。再次检索 ben 对象时,与之相关的配偶信息不仅已经存储而且还被自动检索。
思考一下,这包含了可怕的暗示。尽管可以想见 OODBMS 是如何避免无限递归 的场景,更恐怖的问题在于,设想一个对象有着对其他几十个、成百上千个对象的引用,每个引用对象又都有着其自身对其他对象的引用。不妨考虑一下模型表示子女、双亲等的情景。仅仅是从数据库中取出一个 Person 就会导致追溯到所有人类的源头。这意味着在网络上传输大量对象!
幸运的是,除了那些最原始的 OODBMS,几乎所有的 OODBMS 都已解决了这个问题,db4o 也不例外。
db4o 的探察测试
考察 db4o 的这个领域是一项棘手的任务,也给了我一个机会展示一位好友教给我的策略:探察测试。(感谢 Stu Halloway,据我所知,他是第一个拟定该说法的人。) 探察测试,简要而言,是一系列单元测试,不仅测试待查的库,还可探究 API 以确保库行为与预期一致。该方法具有一个有用的副作用,未来的库版本可以放到探察测试代码中,编译并且测试。如果代码不能编译或者无法通过所有的探察测试,则显然意味着库没有做到向后兼容,您就可以在用于生产系统之前发现这个问题。
对 db4o API 的探察测试使我能够使用一种 “before” 方法来创建数据库并使用 Person 填充数据库,并使用 “after” 方法来删除数据库并消除测试过程中发生的误判(false positive)。若非如此,我将不得不记得每次手工删除 persons.data 文件。坦白说,我并不相信自己在探索 API 的时候还能每次都记得住。
我在进行 db4o 探察测试时,在控制台模式使用 JUnit 4 测试库。写任何测试代码前,StructuredObjectTest 类如清单 4 所示:
清单 4. 影响 db4o API 的测试
import java.io.*;
import java.util.*;
import com.db4o.*;
import com.db4o.query.*;
import com.tedneward.model.*;
import org.junit.Before;
import org.junit.After;
import org.junit.Ignore;
import org.junit.Test;
import static org.junit.Assert.*;
public class StructuredObjectsTest
{
ObjectContainer db;
@Before public void prepareDatabase()
{
db = Db4o.openFile("persons.data");
Person ben = new Person("Ben", "Galbraith",
Gender.MALE, 29, Mood.HAPPY);
Person jess = new Person("Jessica", "Smith",
Gender.FEMALE, 29, Mood.HAPPY);
ben.setSpouse(jess);
db.set(ben);
db.commit();
}
@After public void deleteDatabase()
{
db.close();
new File("persons.data").delete();
}
@Test public void testSimpleRetrieval()
{
List<Person> maleGalbraiths =
db.query(new Predicate<Person>() {
public boolean match(Person candidate) {
return candidate.getLastName().equals("Galbraith") &&
candidate.getGender().equals(Gender.MALE);
}
});
// Should only have one in the returned set
assertEquals(maleGalbraiths.size(), 1);
// (Shouldn't display to the console in a unit test, but this is an
// exploration test, not a real unit test)
for (Person p : maleGalbraiths)
{
System.out.println("Found " + p);
}
}
}
自然,针对这套测试运行 JUnit 测试运行器会生成预计输出:要么是“.”,要么是绿条,这与所选择的测试运行器有关(控制台或 GUI)。注意,一般不赞成向控制台写数据 —— 应该用断言进行验证,而不是用眼球 —— 不过在探察测试里,做断言之前看看得到的数据是个好办法。如果有什么没通过,我总是可以注释掉 System.out.println 调用。(可以自由地添加,以测试您想测试的其他 db4o API 特性。)
从这里开始,假定清单 4 中的测试套件包含了代码示例和测试方法(由方法签名中的 @Test 注释指明)。
存取结构化对象
存储结构化对象很大程度上和以前大部分做法一样:对对象调用 db.set(),OODBMS 负责其余的工作。对哪个对象调用 set() 并不重要,因为 OODBMS 通过对象标识符(OID)对对象进行了跟踪,因此不会对同一对象进行两次存储。
Retrieving 结构化对象则令我不寒而栗。如果要检索的对象(无论是通过 QBE 或原生查询)拥有大量对象引用,而每个被引用的对象也有着大量的对象引用,以此类推。
避免无限递归
不管大多数开发者的最初反应(一般是 “不可能是这样的吧,是吗?”)如何,无限递归在某种意义上正是 db4o 处理结构化对象的真正方式。事实上,这种方式是绝大多数程序员希望的,因为我们都希望在寻找所创建的对象时,它们正好 “就在那里”。同时,我们也显然不想通过一根线缆获得整个世界的信息,至少不要一次就得到。
db4o 对此采用了折衷的办法,限制所检索的对象数量,使用称为激活深度(activation depth)的方法,它指明在对象图中进行检索的最低层。换句话说,激活深度表示从根对象中标识的引用总数,db4o 将在查询中遍历根对象并返回结果。在前面的例子中,当检索 Ben 时,默认的激活深度 5 足够用于检索 Jessica,因为它只需要仅仅一个引用遍历。任何距离 Ben 超过 5 个引用的对象将无法 被检索到,它们的引用将置为空。我的工作就是显式地从数据库激活那些对象,在 ObjectContainer 使用 activate() 方法。
如果要改变默认激活深度,需要以一种精密的方式,在 Configuration 类(从 db.configure() 返回)中使用 db4o 的 activationDepth() 方法修改默认值。还有一种方式,可以对每个类配置激活深度。在清单 5 中,使用 ObjectClass 为 Person 类型配置默认激活深度:
清单 5. 使用 ObjectClass 配置激活深度
// See ObjectClass for more info
Configuration config = Db4o.configure();
ObjectClass oc = config.objectClass("com.tedneward.model.Person");
oc.minimumActivationDepth(10);
更新结构化对象
更新所关注的是另外一个问题:如果在对象图中更新一个对象,但并没有做显式设置,那么会发生什么?正如最初调用 set() 时,将存储引用了其他存储对象的相关对象,与之相似,当一个对象传递到 ObjectContainer,db4o 遍历所有引用,将发现的对象存储到数据库中,如清单 6 所示:
清单 6. 更新被引用的对象
@Test public void testDependentUpdate()
{
List<Person> maleGalbraiths =
db.query(new Predicate<Person>() {
public boolean match(Person candidate) {
return candidate.getLastName().equals("Galbraith") &&
candidate.getGender().equals(Gender.MALE);
}
});
Person ben = maleGalbraiths.get(0);
// Happy birthday, Jessica!
ben.getSpouse().setAge(ben.getSpouse().getAge() + 1);
// We only have a reference to Ben, so store that and commit
db.set(ben);
db.commit();
// Find Jess, make sure she's 30
Person jess = (Person)db.get(
new Person("Jessica", "Galbraith", null, 0, null)).next();
assertTrue(jess.getAge() == 30);
}
尽管已经对 jess 对象做了变动, ben 对象还拥有对 jess 的引用。因此内存中 jess Person 的更新会保存在数据库中。
其实不是这样。好的,我刚才是在撒谎。
测试误判
事实是,探察测试在某个地方出问题了,产生了一个误判。尽管从文档来看并不明显, ObjectContainer 保持着已激活对象的缓存,所以当清单 6 中的测试从容器中检索 Jessica 对象时,返回的是包含变动的内存对象,而不是写到磁盘上真正数据。这掩盖了一个事实,某类型的默认更新深度 是 1,意味着只有原语值(包括 String)才会在调用 set() 时被存储。为了使该行为生效,我必须稍微修改一下测试,如清单 7 所示:
清单 7. 测试误判
@Test(expected=AssertionError.class)
public void testDependentUpdate()
{
List<Person> maleGalbraiths =
db.query(new Predicate<Person>() {
public boolean match(Person candidate) {
return candidate.getLastName().equals("Galbraith") &&
candidate.getGender().equals(Gender.MALE);
}
});
Person ben = maleGalbraiths.get(0);
assertTrue(ben.getSpouse().getAge() == 29);
// Happy Birthday, Jessica!
ben.getSpouse().setAge(ben.getSpouse().getAge() + 1);
// We only have a reference to Ben, so store that and commit
db.set(ben);
db.commit();
// Close the ObjectContainer, then re-open it
db.close();
db = Db4o.openFile("persons.data");
// Find Jess, make sure she's 30
Person jess = (Person)db.get(
new Person("Jessica", "Galbraith", null, 0, null)).next();
assertTrue(jess.getAge() == 30);
}
测试时,得到 AssertionFailure,说明此前有关对象图中层叠展开的对象更新的论断是错误的。(通过将您希望抛出异常的类类型的 @Test 注释的值设置为 expected,可以使 JUit 提前预测到这种错误。)
设置层叠行为
Db4o 仅仅返回缓存对象,而不对其更多地进行隐式处理,这是一个有争议的话题。很多编程人员认为要么这种行为是有害的并且违反直觉,要么这种行为正是 OODBMS 应该做的。不要去管这两种观点优劣如何,重要的是理解数据库的默认行为并且知道如何修正。在清单 8 中,使用 ObjectClass.setCascadeOnUpdate() 方法为一特定类型改变 db4o 的默认更新动作。不过要注意,在打开 ObjectContainer 之前,必须设定该方法为 true。清单 8 展示了修改后的正确的层叠测试。
清单 8. 设置层叠行为为 true
@Test
public void testWorkingDependentUpdate()
{
// the cascadeOnUpdate() call must be done while the ObjectContainer
// isn't open, so close() it, setCascadeOnUpdate, then open() it again
db.close();
Db4o.configure().objectClass(Person.class).cascadeOnUpdate(true);
db = Db4o.openFile("persons.data");
List<Person> maleGalbraiths =
db.query(new Predicate<Person>() {
public boolean match(Person candidate) {
return candidate.getLastName().equals("Galbraith") &&
candidate.getGender().equals(Gender.MALE);
}
});
Person ben = maleGalbraiths.get(0);
assertTrue(ben.getSpouse().getAge() == 29);
// Happy Birthday, Jessica!
ben.getSpouse().setAge(ben.getSpouse().getAge() + 1);
// We only have a reference to Ben, so store that and commit
db.set(ben);
db.commit();
// Close the ObjectContainer, then re-open it
db.close();
db = Db4o.openFile("persons.data");
// Find Jess, make sure she's 30
Person jess = (Person)db.get(
new Person("Jessica", "Galbraith", null, 0, null)).next();
assertTrue(jess.getAge() == 30);
}
不仅可以为更新设置层叠行为,也可以对检索(创建值为 “unlimited” 的激活深度)和删除设置层叠行为 —— 这是我最新琢磨的 Person 对象的最后一个应用 。
删除结构化对象
从数据库中删除对象与检索和更新对象类似:默认情况下,删除一个对象时,不删除它引用的对象。一般而言,这也是理想的行为。如清单 9 所示:
清单 9. 删除结构化对象
@Test
public void simpleDeletion()
{
Person ben = (Person)db.get(new Person("Ben", "Galbraith", null, 0, null)).next();
db.delete(ben);
Person jess = (Person)db.get(new Person("Jessica", "Galbraith", null, 0, null)).next();
assertNotNull(jess);
}
但是,有些时候在删除对象时,希望强制删除其引用的对象。与激活和更新一样,可以通过调用 Configuration 类触发此行为。如清单 10 所示:
清单 10. Configuration.setCascadeOnDelete()
@Test
public void cascadingDeletion()
{
// the cascadeOnUpdate() call must be done while the ObjectContainer
// isn't open, so close() it, setCascadeOnUpdate, then open() it again
db.close();
Db4o.configure().objectClass(Person.class).cascadeOnDelete(true);
db = Db4o.openFile("persons.data");
Person ben =
(Person)db.get(new Person("Ben", "Galbraith", null, 0, null)).next();
db.delete(ben);
ObjectSet<Person> results =
db.get(new Person("Jessica", "Galbraith", null, 0, null));
assertFalse(results.hasNext());
}
执行该操作时要小心,因为它意味着其他引用了被消除层叠的对象的对象将拥有一个对 null 的引用 —— db4o 对象数据库在防止删除被引用对象上使用的引用一致性 在这里没有什么作用。(引用一致性是 db4o 普遍需要的特性,据说开发团队正在考虑在未来某个版本中加入这一特性。对于使用 db4o 的开发人员来说,关键在于要以一种不违反最少意外原则 的方式实现,甚至某些时候,即使是在关系数据库中,打破一致性规则实际上也是一种理想的实践。)
写在最后
本文是该系列文章的分水岭:在此之前,我使用的所有示例都基于非常简单的对象,从应用角度来讲,那些例子都不现实,其主要作用只是为了使您理解 OODBMS,而不是被存储的对象。理解像 db4o 这样的 OODBMS 是如何通过引用存储相关对象,是比较复杂的事情。幸运的是,一旦您掌握了这些行为(通过解释和理解),您所要做的就只是开始调整代码来实现这些行为。
在本文中,您看到了一些基本例子,通过调整复杂代码来实现 db4o 对象模型。学习了如何对结构化对象执行一些简单 CRUD 操作,同时,也看到了一些不可避免的问题和解决方法。
其实,目前的结构化对象例子仍然比较简单,对象之间还只是直接引用关系。许多夫妻都知道,结婚一段时间后,孩子将会出现。本系列的下一文章中,我将继续探索 db4o 中的结构化对象的创建与操作,看看在引入若干子对象后, ben 和 jess 对象将发生什么。
上一篇:Java中读取字符文件类
扫码关注微信公众号了解更多详情
跟技术大咖,专业导师一起交流学习