既然是数据(jù)管理,首(shǒu)先(xiān)就要明确管理多(duō)少数据。数据(jù)量的多少直接(jiē)影响(xiǎng)媒资(zī)系统统计出客户需(xū)要保(bǎo)存的节目(mù)时间、节目(mù)增量和工(gōng)作目(mù)标,进而得出各站点的数量,最终确定媒体文件和元数据的存储空间。个(gè)人认(rèn)为应当从以下(xià)几方面来考虑:
1. 系统中高低码率文件编码方式和(hé)码率的选择。对台内现有数字(zì)化系统的资料(liào)进行保(bǎo)存(cún)时,一(yī)般(bān)可选用(yòng)制作(zuò)网、新闻网或(huò)播出网中的原(yuán)始文件格(gé)式。现在的(de)媒资管理系统基(jī)本(běn)上可对多种(zhǒng)码率、多种(zhǒng)编码格(gé)式的(de)节目资料文件统一管理,这样(yàng)既(jì)避免了(le)转码带来的时间、空间(jiān)上的(de)浪(làng)费,又防止出(chū)现因转(zhuǎn)码可能带来(lái)的视音频质量(liàng)损失。
表1 媒资系统高(gāo)低码率(lǜ)格式的(de)选(xuǎn)择
如上表(biǎo)所示,海量存储一定是多格式的,从长(zhǎng)远来看(kàn),不管是高清还是标清压缩算法都会改(gǎi)变(biàn),面向应用(yòng)也(yě)会有(yǒu)不同的考虑,而且允许针对不同的(de)节目(mù)形态在节目类型方面做一些(xiē)优化,例如(rú)改变文件的封装方式(shì)以有效提高效率(lǜ)等,这些优化都是有针对性的,需要根据实际(jì)情况制定相应(yīng)的策略。
2. 上载工作站和编目工作(zuò)站数量的(de)确定。上载工(gōng)作站(zhàn)的数量主(zhǔ)要是(shì)根据用户每天需要上载的传统磁带节目量的大小来确定的。由于上载的过程是1:1的信号上(shàng)载,通常需要了解用户现(xiàn)有的磁带(dài)类型,各类节目的库存量,计划完成节目(mù)数字化采集上(shàng)载(zǎi)的工作时间(jiān)(如一年内完成多少(shǎo)小时等),由此计算出(chū)每天需(xū)要上载的节(jiē)目量,从而得到系统需(xū)要配置多少台上载(zǎi)工(gōng)作站。个人认(rèn)为还需要注意(yì)的是,要考(kǎo)虑到上载工作站的可用时(shí)间以(yǐ)及上载人员的工作习惯,相应增加站点的(de)数量(liàng),常见(jiàn)的配置方(fāng)案是(shì)6小时/每天的(de)上载(zǎi)量对应1台工(gōng)作站。
此外,如果仅仅考虑完成传统磁带(dài)上载保存的话(huà),简(jiǎn)单计算可(kě)按(àn)每(měi)台上载工作站对应需(xū)要配置2台编目工作(zuò)站来配置;如果考虑(lǜ)保存其他系统的数字化成品和素材,每天每(měi)增加(jiā)3小时的编目工(gōng)作就应相应(yīng)增加1台编(biān)目工作站即可。
3. 明确数据总(zǒng)量(liàng),科学(xué)规(guī)划存储系统(tǒng)配置。在确定了媒资系(xì)统的上载站点和上(shàng)载时间后,基本上(shàng)就(jiù)可以明确在(zài)一个较长的时间内数据量的大小,这也对存储系(xì)统的选型、配置提出了要求(qiú)。媒(méi)资的存储系统通常包括在线盘阵和近线数据流磁带库,同时我们(men)也要把媒资系统数据库的元数据作为数(shù)据管理(lǐ)的重要(yào)对象之一(yī)来对其(qí)进行存(cún)储规划:
·在线(xiàn)盘阵主要存储(chǔ)媒体文(wén)件、关键帧等数据,同时还可(kě)以(yǐ)作(zuò)为(wéi)提供上载的缓冲(chōng)区和下载的(de)缓冲(chōng)区。高低码率文件都(dōu)可以储存(cún)到(dào)在线盘(pán)阵中,也(yě)可以部署单(dān)独的高、低(dī)码(mǎ)率文件存储(chǔ)管理服务器。低码率文件除了作为(wéi)编目、检索(suǒ)的(de)预览文件,还可(kě)以用来(lái)对素材(cái)进行简(jiǎn)单的粗(cū)编(biān),所以一般不删除一直占据着相(xiàng)应的(de)存(cún)储空间,如果(guǒ)条件允许,可以考虑(lǜ)单独部署一台流媒(méi)体管理(lǐ)服(fú)务(wù)器来对其(qí)进行存(cún)储和管(guǎn)理,这样对于缓冲区、流媒体存储空(kōng)间的规划就(jiù)相对宽(kuān)松;而如果只有(yǒu)一个在(zài)线盘阵,其容量(liàng)就要根据低码(mǎ)率文件的容量(liàng)加上上载和下载缓冲区大小来计算。这就(jiù)是一(yī)个相对不确定的数(shù)量,因为上载(zǎi)和(hé)下载对缓(huǎn)冲区的(de)使(shǐ)用是(shì)不确定的,解决办法就是尽可能地扩大在线盘阵的(de)存储(chǔ)容量,使其在满足较长时间内的存储任务(wù)的同时,兼顾为日常进出媒资(zī)的(de)数据提供(gòng)足够的临时空(kōng)间。