UML软件工程组织

                        构建全球性网站
                        在网站上用访问者的语言销售商品(或只是结交朋友)

Michael Lerner
Learn the Net.com 的作者和总裁(选自IBM中国)
参与全球经济意味着要有一个能被全世界的客户和公众所理解的网站。从语言翻译开始,想办法使您的网站有效地延伸到其他文化中去。但不要停留于翻译 — 本地化您的网站。为了使本化地工作较为容易,本文提出了十点忠告。

英语仅是七个国家(澳大利亚、加拿大、爱尔兰、新西兰、南非、英国和美国)的官方语言,总人口仅为世界人口的百分之五。但在线内容的一半以上都是英文的。虽然许多商务人员将英语作为第二语言,但大多数人更愿意用他们自己的语言进行交流。

随着商务的进一步全球化,对网站进行本地化的需求变得越来越紧迫。将一个网站本地化为除英语之外的六种语言(日语、德语、法语、西班牙语、葡萄牙语和瑞典语),该网站就能覆盖目前在线人口的 90%。

当然,目标语言取决于一个公司认为哪儿适合开拓它的市场。而且也没必要对整个网站进行本地化。您可以先对几个关键页进行本地化,并以此为基础来测试是否存在有潜力的市场。不管您通过哪种途径,新的工具和服务现在使这个富有挑战性的工作更易于处理了。

小标题:翻译与本地化

“单凭翻译并不能使您的网站实现本地化,”Yahoo 国际部高级制作人 Arthine van Duyne 说。熟练的本地化 — 使网站看起来就像最初是用目标语言开发的一样 — 依赖于您对所面向的对象的深入理解。在开始这一过程之前,请考虑您希望您的网站覆盖哪些人。“您必须立足于文化和市场来考虑用户,以便理解他们关注的焦点是什么,”YAR Communications 富有创造性的主管 Ted Xistris 说。该公司是以纽约为基地的一家广告和通信公司,它已为十个客户进行了本地化,这些客户包括 AT&T、Nike 和 EDS。

例如,美国人往往很直率和亲密。但是这种风格和语气在其他国家就可能不那么合适。例如,在讲西班牙语的国家,商务活动往往相当正式。

小标题:意想不到的结果

字面翻译经常不能表达原意。以英国为基地的 RWS Group(请参阅本文最后的参考资料部分)的业务发展代表 Brian Crouch 引用了 Got Milk 运动。“当您将‘slogan(口号)’翻译为西班牙语时,它的意思是‘您在分泌乳汁吗?’”;他说找出语言上的异常情况并提出替代方案不是翻译的工作,而是编辑的工作。

依赖于通俗文化暗示的幽默也可能不易“理解”,所以在翻译之前您可能需要重写英文稿。 YAR Communications,Xistris 把它比作“广告业联合国”,有来自多个国家的员工复审材料是否适当。如果您与不同文化背景的员工一起工作,您就有机会在自家的后院里商讨这些问题。

Yahoo!,其产品覆盖 19 个地区和 12 种语言,并分别雇佣了由当地人组成的本地化小组。这些小组由制作人、编辑和工程师组成。Van Duyne 说,这是使它正常运转的唯一方式。她列举了 Yahoo! 的一种在线产品 — 通讯簿 — 它按英文的字母顺序排列人名。但是,在亚洲国家,人名是按击键数排列的,这是本地化小组的一项发明。

小标题:人工翻译

传统上,翻译是由受过训练的专业人员完成的,理想的情况是由以目标语言(即要将文本翻译成的语言)为母语的人员来完成。这种工序可以得到最好的结果,但它既耗时,又耗财。翻译服务公司通常按字数收费。据 Berlitz 的销售代表 Karisa Stickler 称,该公司有一个三人小组:一个翻译、一个编辑、一个校对。将一篇 250 字(大约一页)的文档翻译为欧洲语言和亚洲语言,大约需要 250 美元。返回时间为三到西个工作日。

服务公司的价格相差很大,多找几家进行比较是值得的。 基于 Web 的 eTranslate,将一页内容翻译为欧洲语言收费 50 美元,翻译为亚洲语言收费 60 美元。该公司保证 72 小时交付。eTranslate 声称全球有来自 80 个国家的 6,000 名懂两种语言的当地人为它服务,翻译人员通过电子邮件接收文档,然后进行翻译。

Uniscape 表示它的翻译管理系统通过收集和重新使用单词和短语削减了翻译成本。这项服务有点像通晓数种语言者的市场,它允许客户张贴作业,而翻译人员可以对该项目进行投标。然后通过将译文存储在数据库中,这些元素就可以在以后的翻译中被重新使用,从而节省了时间和费用。该公司声称它的系统至少可以将翻译成本削减 20%。

小标题:机器翻译

二十世纪的计算机科学家已作了几十年的努力来完善机器翻译软件,并取得了不同程度的成功。但是,到目前为止,由计算机令人信服地完成翻译仍然是一种科学幻想。现在的机器翻译系统都是接收一种语言的文本,然后以另一个语言输出。这种软件不是逐字翻译,而是首先分析文本,然后使用一组语法规则和一个数据库(通常是一部字典)将文本翻译为目标语言。字典决定使用哪些术语;字典的不同造成了机器翻译程序之间的差异。虽然这一技术已得到一定程度的提高,但准确率却相差很大,这取决于所翻译的文本。

Ghassan Haddad 是一位计算语言学家,他花了多年的精力开发机器翻译软件。他现在执掌着 Berlitz GlobalNet 的运作。Haddad 说,机器翻译最适合于文字遵循标准英语规则、没有歧义的技术文档。“但无法使机器翻译输出可出版的文本,”Haddad 说。“您必须让一个人来审查和编辑文本。”Haddad 补充道,“在 Berlitz,我们每年要翻译数百万字。只要机器翻译能将我们的效率提高几个百分点,我们就会使用它。但我们没有使用。这应该能向您说明点什么。”

机器翻译确实能让读者了解文档的要点。如果您是一个开发人员或研究人员,需要对一篇文档的大致内容作一了解,那么机器翻译可以满足要求。对于解释外文的电子邮件,它也可能非常方便。但在您的网站上张贴机器翻译的文本时要格外小心。您这样做可能要冒一定的风险,您可能因所提供的内容让人感觉翻译得很草率 — 并且可能很可笑 — 而疏远了读者。尽管如此,机器翻译对于某些项目可能会很有用。

 

对于那些预算有限的开发人员而言,Systran 和 Transparent Language 提供一种基于 Web 的免费翻译服务(请参阅参考资料)。您可能已经使用过 Systran 的 Babel Fish 技术对 AltaVista 的内容进行快速翻译。通过在在线文本域中输入文本或 URL,就可以将其翻译为多种欧洲语言。对陈述句翻译得最好;对更复杂的语句的翻译,用最慈善的话来说,可以说是很有诗意。您可以自己试一试,看它是否能满足您的要求。Systran 也出售翻译软件,个人版软件的售价为 69 美元,企业版软件的售价为 975 美元。

 

Transparent Language,Inc. 在 FreeTranslation.com 提供免费服务。该公司也出售经过压缩打包的软件。

 

为了举例说明机器翻译的反复无常,我分别使用 Systran 和 FreeTranslation 服务将下面这人句子翻译成西班牙文:English is the official language of only seven countries(英语只是七个国家的官方语言)。 下面是翻译结果:

  • FreeTranslation:El ingles el idioma oficial de so siete paes.
  • Systran:El ingles el lenguaje oficial de so太差nte siete paes.

虽然单凭一个句子的翻译很难对这两个程序作出准确的评价,但它确实说明了一个事实:即使对简单的句子,翻译也存在偏差,主要取决于各个产品所使用的字典不同。但是,Berlitz 的一位西班牙翻译指出,在 Systran 翻译中的 lenguaje 一词在一般语境中(而非在特定语境中)使用时是不正确的。

小标题:文化方面的考虑

除了翻译文本之外,请检查网站的其他方面是否适合您所面向的对象。这包括设计元素、图标、导航系统、形象和颜色。YAR Communications 的 Ted Xistris 列举了最近的一个项目,Apple Computers 对 iMac 的推广。他说,仅仅翻译产品说明书是不够的;YAR 必须确定在每个市场中哪种颜色的 iMac 能成为特色。在大多数情况下,希望找目标地区的咨询方提供指导。“要研究每种文化,以便找出最有效的东西,”Xistris 建议说。

确保您的链接与您的网站使用相同的语言。例如,如果您的网站链接到英文资源,而您正在将您的网站本地化为日文,则您希望找到类似的日文网站,或者至少要表明您所链接的网站是英文的。

小标题:技术问题和 Unicode

除了内容的本地化以外,还必须解决许多技术问题。最令人头痛的一个问题就是不同字符集的使用。西方语言,如英语、法语和德语,使用不到 256 个字符,因此它们可以用单字节码表示。亚洲语言,包括日文和中文,有几千个字符,因此需要双字节编码。

Unicode,由 Unicode Consortium 开发,是一个新出现的标准,其设计目的是为了使计算机能够交换和显示全世界的语言。(请参阅参考资料。)根据该组织的使命陈述,“Unicode 为编码多种语言的纯文本提供一种一致的方法,并将使国际间交换文本文件难以实现的混乱状态引向规范化。”ASCII 使用 8 位表示一个字符,而 Unicode 使用 16 位表示一个字符,即它能够表示多达 65,000 个字符。Unicode 为一种语言的每个字符分配了一个唯一的编号。虽然 Unicode 目前还不能支持每一种语言,但它确实覆盖了世界上主要的书面语言。

好消息是 Internet Explorer 和 Navigator 4.0 及更高版本都支持用 Unicode 编码的文本,并能正确显示它。坏消息是 Unicode 不是通用标准。使用其他方案编码的双字节文本需要有插件才能正确显示。

小标题:从右到左阅读的语言和纵向阅读的语言的显示

使问题进一步复杂化的是像阿拉伯语和希伯来语这样的语言,它们是从右到左阅读的。除了 Unicode 之外,没有其他一致的方法能使浏览器处理这些语言的文本显示。虽然也存在一些替代办法,但它们都与具体的平台和浏览器有关。

根据 Working Group 最近的一个声明,万维网联合会 (World Wide Web Consortium) 目前正在为 HTML 4.0 开发一种标准,“以保证 W3C 的格式和协议可用于世界上的任何语言和书写系统。”W3C 和 Unicode 技术委员会 (Unicode Technical Committee) 即将实现这些标准。

小标题:动态网站和本地化

动态驱动的网站提出了另一个问题。“数据库必须适应二进制信息,”Berlitz 的因特网开发人员 Kit Dang 说。Dang 建议从开始就要将兼容性构建到数据库中,而不要等到本地化网站时才不得不转换它。其他后台软件可能也必须修改,尤其是电子商务网站。

最后,每种语言的主页应该针对特定地区的搜索引擎和目录进行优化。您必须确定哪些搜索引擎和目录最受欢迎,并了解它们是如何工作的,然后调整您的元数据标签和关键字。“这是一个耗时的过程,”Ted Xistris 富有创造性的主管说,“但它可以从对该网站的点击数得到回报。”

小标题:多种语言的维护

在将您的网站本地化为多种语言之后,您如何维护他们呢?理想的情况是,当您更英文网站时,您希望其他网站的内容同时也被更新。

Uniscape 提供了一种解决方案。(请参阅参考资料。)其翻译管理系统跟踪您对原来的 HTML 文件的更改,然后将更改的部分发送给预定的翻译人员。

Global Sight 发布的企业软件提供对多语言网站的集中管理。(请参阅参考资料。)该软件从 HTML 代码中提取内容。在翻译完成以后,它会自动生成目标语言的 HTML 页面。该软件支持版本控制、自动化工作流程和内容编辑。它支持 Unicode,所以能处理双字节字符。Global Sight Ambassador 软件的起价为 100,000 美元。

RKS Group 的 Brian Crouch 声称,在您开始项目之前,不可能计算本地化网站的投资回报率。但他说,努力通常会带来回报,或者增加了客户服务,或者使电子商务网站对用户更友好。“辛勤的工作可能经过一段时间才能结出果实,但它迟早会结出果实。”

 

标题:避免本地化失误的十种方法

预先计划。即使不准备立即本地化您的网站,也应该将本地化纳入您的设计方案中。例如,翻译 HTML 文本的费用比改图的费用少。将图形保存为分层的文件(文本占单独的一层)会使它们较容易更改,将文本置于图形 之下而不是置于图形之上也会使更改较为容易。

各种语言并不均衡。 对于同一个句子,其英语表达可能比德语表达长 20%,而可能比印度语表达长 80%。中文的阅读方向是从上到下;希伯来文的阅读方向是从右到左。请考虑这可能会对页面布局产生什么样的影响。灵活的设计效果最佳。

了解文化的差异。 欧洲人通常穿白色服装参加婚礼;而中国人通常穿白色服装参加葬礼。美国的八角形停止标志图标在世界上的许多地方并不代表任何意义。

提供一种清晰的选择。 在 Web 上,群体以语言来标识,而不是以国家来标识,除非网站确实是针对某个特定国家进行本地化的。如果不是这样,使用国旗指示语言就可能造成混乱。试想一下如果用爱尔兰国旗代表英语会怎样。最好用名称列出各种语言。

了解读者。 说英语的人都知道,美国英语和英国英语有明显的区别。其他语言也一样。

不要使用俚语。 每种语言都使用口语表达,但它们很难翻译。当然,如果您的目标读者喜欢俚语,则请安排资金和时间将该文本转换为方言。

考虑带宽。 美国以外的许多因特网用户的网速很慢,并可能需要按分种付费。因此反应迟缓的、含有大量图形的网站效果并不理想。

增强后端。 如果您的网站使用表单,是否可以输入和处理用英语以外的其他语言表示数据?对于使用双字节字符的语言,这尤其是一个挑战。

检验网站。 在开始使用之前,一定要同您的目标读者一起检查本地化网站。如果不执行这个步骤,结果可能会损失惨重。

及时更新。 本地化网站不应该成为英文网站的被遗忘的同胞。一定要对它进行技术维护,并定期更新内容。

参考资料

作者简介

Michael Lerner 是 Learn the Net.com 的总裁,该网站提供基于 Web 的技术培训服务。该网站以英语、西班牙语、法语、德语和意大利语发布。另外,他还为 Forbes.com 撰写技术文章。可以通过 info@learnthenet.com 与他联系。

 
 

版权所有:UML软件工程组织