- ■ 痛苦的2星期
-
- 我一遍又一遍地重复着以下的各项操作。
- 再次安装Redhat Linux
- Linux的Kernel Batch
- 再次安装Dialogic SDK
- 更换Dialogic语音识别板插入PCI BUS的位置
- 查看英特尔公司的美国网站上的FAQ等
- 检索在日本,Linux + Dialogic语音识别板卡是否有实绩
- 对知熟的技术人员朋友发送电子邮件
- 在Google上检索的次数更是难以计算
- 尤其是从1~4项,更是反反复复地重复着操作。特别是对第4项的更换Dialogic语音识别板插入PCI BUS的位置进行了多次重复操作。
- 给朋友发出的邮件,返回来的内容也都不是有关Linux的。都是说“如果是有关Windows的话,就能帮上忙了。”就这样的转来转去,只是在浪费时间。
- 对于是查看英特尔公司的美国网站的人来说,也都是不明白的占大多数。对更进一步的情报却是一点儿也没有。在美国的Yahoo网站上,我既使是变换着输入检索关键词,也没有找到解决问题的好方法。在那上面,大家都在为找不到相应的解决方法而正在感到为难,研究也为此而停止不前。而且,有关挑战Linux的内容几乎是没有,全都是有关Windows的。但我所想要的不是有关Windows的情报。
- 就这样,我继续在网上搜索着。
- 在查找中,有一家公司正在销售Linux+Dialogic的组合而成的产品。我抱着试试看的心情给那家公司发送了邮件,希望得到帮助。
- ===================邮件开始===================
- 承盟关照
- ■ 本邮件的宗旨
- 这个邮件是关于询问是否能够对Dialogic语音识别板+LINUX给予支持。
- ■ 本公司想进行的事项
- 本公司想进行开发利用Dialogic语音识别板的语音识别Demo。本公司的要件是要在Linux上实现。在Dialogic的手册中,虽然说是对应Linux,但实际上却发生了根本不被识别而延缓了开发的情况。(在WINDOWS上已确认完毕,并试着调查了Dialogic的Patch、Linux版本)。在那里,以贵公司的Dialogic+Linux的实绩为本,可不可以为本公司提供技术支持。
- ■ 支持要件
- 请指教在Linux上安装Dialogic的顺序。
- ■ 要求回答的内容
- 请回答是否可以提供支持
- 请出示提供支持信息所需费用
- 非常感谢您的合作,拜托了。
- ===================邮件结束===================
- 邮件发出后,并没有收到回信。看来这确实是技术机密,是不会轻易传授给人的。这个公司在研究这方面时一定也吃了不少苦。就这样,我真是走进了四面楚歌的局地。
- 在这一天,我在Linux环境上作了最后的一次挣扎,如果再不行的话就只好返回Windows上了。
- 不过,这一次我却成功了,真是老天开眼了。唉呦喂!这可真是够费事儿的。接下来理所当然地样本应用软件也运作了。就象是运作在Windows上一样。
- 「哔--啵--叭」「嘟----」「喀嚓」「@*?#$%」
- 虽然是播放出来的是英文,但是不管怎样,接受电话进行播放总算是实现了。这次又运作其他的样本应用程序试着拨打电话。在拨打了公司的电话后,很顺利地就通过了。
- 啊,我真是太高兴了。同时也放心了。不管怎么说我这也是被折磨了2个多星期。今天终于可以放心地回家痛痛快快地喝杯啤酒庆祝一下了。
- 嘿,就甭提我有多高兴了。
- ■ 重新进行
-
- 在Linux上Dialogic语音识别板的识别成功了,剩下就是验证在模拟Linux环境下开发成的程序是否进行正常运转,我正等着这个验证呢。
- 不过,虽然说是模拟,但因为是在Linux环境上开发的程序,所以很顺利地就运转了。
- ■ 相遇Bayonne
-
- 虽然是顺利地在Linux环境下开发成了应用程序,不过,又出现了问题。
- 「Dialogic语音识别板可以连接4条线路。这就是说会发生4条线路同时接受来电的情况。用Perl真的没问题吗?现在用的是Dialogic D/4PCI语音识别板,那么也可以用Dialogic的其他型号的语音识别板吗?」
- 现在的构造是,在启动应用程序时,因为是分配了Dialogic D/4PCI语音识别板的4条线路中的1条,作为参数被指定来启动应用程序。也就是说,为了对应4条线路就有必要经过4次的启动。理论上来说既使是4条线路同时接收来电应用程序也是在运转,不过实际上是否真的在运转那就是另外一回事儿了。
- 在这里「先等一下,在地狱般的2星期中所找到的情报里不是有关于GNU工程的Telecom软件吗。那个应该是对应于Dialogic的。不管是什么都有调查的价值,不是吗。」就从这里,我着手开始了调查Bayonne。
- ■ 安装Bayonne
-
- 我立刻从GNU工程的网站上下载了Bayonne。
- 除了Bayonne以外下载的还有∶
- GNU Common C++
- GNU ccScript
- GNU ccAudio
- 因为都是必需的,所以我就全部下载了。
- 安装也顺利地进行着,并对附属的样本程序的运作进行了确认。
- 「哔--啵--叭」「嘟----」「喀嚓」「@*?#$%」「press 1 to play or 2 to record」
- 什么什么,按1号键是再生,按2号键是录音。我试着按了2号键。「enter the 3 digit prompt you wish to record」请输入3位的号码,我试着按了3位的号码「111」。在这之后用电话试着说「喂-喂-喂-、试验、试验」,在最后试着按了#号键。听到了最初的播音「press 1 to play or 2 to record」,试着按了1号键。「enter the three digit prompt you wish to play」,并试着输入了刚才的3位的号码「111」。在这之后用电话试着说「喂-喂-喂-、试验、试验」。
- 噢,动了。语音的再生和录音成功了,而且还可以提取拨打的号码。并且,能够识别打来的电话被切断的动作。
- 实际上,到现在为止的Perl应用程序上,一直是不能够识别打来的电话被切断的动作的。现在却成功地能够被识别,真是太了不起了。接着剩下来的就是从Script向数据库的连接和实现让机器讲话了,如果这些都作到的话就可以说是万事具备了。
- 我在不知不觉中就实现了从最近开发的Perl中对C程序库进行呼叫一样的方式,且在美国有此实绩的公司有300多家。而且,美国的Sun MicroSystems公司也好象取得了不错的实绩。如果那样的话,4条线路同时来电也可正常运作。除此之外没有别的办法。我中止了从Perl对C程序库进行控制的方式
- ■ 让机器说话
-
- Bayonne是在美国的卡内基梅隆大学内被研究出的对应于FESTIVAL的软件。FESTIVAL是指在被称为TTS种类的软件中,对想要说出的文字以文本形式过渡和用机器的声音作成语音文件的软件。那个TTS能够再生作成的语音文件,让机器说话。
- 我立即试着对其进行了下载和安装。用say指令参数写下了想说的文字,没有想到真的被说了出来。
- say“Wellcome to our demo site”
- 呀,真让人感动。
- 如果这个完成的话,那么象例如检索在数据库内被登录的商品总览上的商品价格及读出商品价格,或是检索库存总览上的所剩商品库存数以及读出商品库存数等,更加扩大了其使用范围。
- 在容易被听清这一点上,虽然比录制人间的说话声音的效果稍差一些,但是可以读出每次变化的东西。
- 呀,能够这样顺利的确认运作,真是件让人感到愉快的事。
- 不过,有一点让人不放心。是的,就是所说的声调都是英文版的。不过,这也没什么难的。这个本来就是以阅读英文为目的的软件。而且,「欢迎光临」就只能写成say“huan yeng guang lin”。
- 不过,就这样用的话也确实是有点儿费事,那就只有再寻找替代品了。就这样,我在因特网上寻找时,发现了价廉的TTS软件。当然是能够在Linux上运作的软件。
- 我立刻在网上购入了那个软件,并对其作了评价。
- 我输入了「欢迎光临」字符串。当再生作成的语音文件时,就听见了日本语声调的「欢迎光临」。
- 又成功了。而且变得特别容易听清楚。我立刻为了确认从Script可以进行呼叫,作成了试验用Script。
- ■ 不能使用日语
-
- 虽然作成了试验用Script,但是一旦进行读出时就不行了。日本语不被接受。又变得复杂起来了。即使是「欢迎光临」字符串被接受,但在TTS那一方却变成了任谁也看不懂的「@*?#$%」文字。
- 「又是这样。看来用没有被日本语化的软件是不行的。软件的功能和实绩都非常的好,又有很强的潜在能力,就这样放弃了实在是太可惜了。」
- 「对,不能就这样放弃了。」我在心里这样叫着。
- 也就在这里,开放源码的优点被体现出来了。因为是开放源码,如果能够分析出来的话,说不定这个问题就解决了呢。
- 就这样,我立即对开放源码,进行了调试。
- 第1天∶无法进行周边安装
- 第2天∶不管怎么说发现了需要注意的地方
- 第3天∶终于找到了并成功完成了日语化
- 这次再输入了「欢迎光临」字符串,TTS那一方就作出了日本语的「欢迎光临」语音文件。
- ■ 试着连接数据库
-
- Bayonne是用标准形式对应postgreSQL。
- 我立刻安装了postgreSQL。并从因特网上下载、安装了RPM形式的软件包。作成数据库,确认是否可以从psql进行连接。如果在因特网上查找的话很就会找到许多有关postgreSQL的信息。因为是相当备受瞩目的,所以既使在日经电脑(日本有名的电脑杂志)上,也是几乎每个月都会刊登有关向企业系统引进的事例。
- 从psql的连接是没有问题了,我制作了确认用的界面和数据。
- 剩下来,如果从Bayonne能够连接上的话就全部OK。为了设定从Bayonne到postgreSQL上的连接,我立即进行了动作的确认。可是很可惜的是,指南手册非常的难懂,又因为没有样本所以无法发行SQL。没有办法,只能是在因特网上查找,或是再仔细地阅读手册。
- 经过不断的查找,终于在因特网上找到了。以因特网上的情报为基准,我立即发行了SELECT。理所当然地结果被反送回来。成功了,成功了。日本语的界面名和列名也当然能够使用。
- ■ 呼出Perl Script
-
- Bayonne是用标准形式也对应Perl的接口。WEB系统的CGI标准说起来也可以说是普及的相当广泛。又有充分的开发实绩。我也有在过去的系统开发时使用过它的经验。而且,在书籍、互联网、知交好友等方面,信息多也是很有魅力的。
- 我对从Bayonne上能够实行Perl Script进行了设定。
- 我立即对动作进行了确认。并准备了试验用的Perl Script,进行从Bayonne中呼出。向Perl Script交付参数,并在Perl Script中读入文件。在那个文件被保存的号码上加上1并保存到文件中,然后再将那个号码返回给Bayonne。在主业上经常会出现的,我试着计算了一下。果然是加上1后被返送回来。
- 再有,我确认了返回来的数字在过度给TTS后能够被读出。这个也成功了。当然是用日本语进行读出了。Call Flow的控制是指作为Perl Script能够在外部进行处理的Bayonne的Script、文件操作和报告处理等。就这样实现了分工合作。软件也能在自己所擅长的范围内被活用,如果对那些进行分工的话,开发和试验就会变得很轻松。
- ■ 制作商品库存询问的语音样品
-
- 因为大部分的验证已经结束了,所以我试着制作了库存询问样品。
- 我在数据库内作了库存询问样品用的商品总览和用户总览,以及试验用的数据。
- 处理的流程∶
- 播放Wellcome
- 播放接收到的输入的用户ID
- 识别所按的键
- 核对用户总览的存在
- 播放输入进行库存确认的商品代码
- 识别所按的键
- 检索商品总览、取得库存数量
- 读出交付给TTS上的库存数量
- 播放是否需要继续查找
- 识别所按的键
- 继续的话向第5项,如果是终止处理的话切断电话即可。
- 在参考Script的指南手册和样本的基础上推进开发。
- 在上述指令中,在分解每个指令时
- 举起听筒
- 再生语音文件
- 对使用者拨打号码的确认(取得DTMF)
- 实行号码分配处理(如果是1号键就表示是播放「欢迎光临」)
- 使用语音合成进行阅读(1号键被按下)
- 确认指令的每个动作是因为Bayonne的验证已经完了,剩下的就只是需要制作呼出Script就可以了。
- 对于Bayonne的潜在能力应该是无可置疑的,可是完美无缺的软件是不存在的。无论是什么样的语言也都是一样,想要运用自如就必须有一定的技术诀窍,Bayonne的Script也是这样。在每一个指令处理时是没有问题的,但是为了制作一个处理时如果在作Script步骤数的增加函数等的时候,就会出现问题。
- 用Bayonne制作应用软件的诀窍在这里建成了。
- 而且,与画面和帐目票据是不同的,因为用电话进行交接是用眼睛看不见的,所以最重要的就是多次倾听验证其使用的方便性。
- 好了,到这里就是我在开发CTI时所经历的所有过程。如果没有和Bayonne相遇,恐怕我现在还在开发Perl和C程序库呢。
- 对CTI的开发我还会继续进行下去。为了尽早向大家介绍本篇的续篇我正在不断地努力中。请大家静候佳音。
|
| BACK | NEXT | TOP |
|
| Home | CTI | Bayonne | Download | What's New | Profile | Address |
Voice Communication 株式会社
211-0004 日本国神奈川县川崎市中原区新丸子东2-907
TEL: +81-044-455-0038 FAX: +81-044-455-0029
联系我们 voicecn@voice-com.net |
最新更新日:
|
|
| (c) Copyright 2003 VCN, Inc. All right reserved |
|
 |
《Linux新活用方法的发现》
此报告有以下内容提要、此报告免费奉送。资料请求
■开始
■为什么是Linux+Bayonne
■关于本公司所提供CTI
构筑服务
■能够实现成本销减吗?
■有什么好的办法吗?
■苦劳
■本公司所提供的
■课题
■联系我们 |
HOME |