提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
原创|行业资讯|编辑:郝浩|2013-10-11 09:27:10.000|阅读 485 次
概述:Google Drive云服务非常受欢迎,但是由于Google Drive对PDF文件的搜索有一定的局限性,用户在云中搜索和查找文件相当头痛。本文主要介绍如何通过LEADTOOLS PDF SDK 来增强Google Drive云储存的搜索功能。
#慧都22周年庆大促·界面/图表报表/文档/IDE/IOT/测试等千款热门软控件火热促销中>>
由于Google Drive提供了一个安全、可靠、方便的方式来储存和备份文件、图像、音乐和其他文件,因此Google Drive云服务非常受欢迎。然而,对于那些在云中存储了大量数据的用户来说,搜索和查找文件相当头疼。多数搜索功能受到限制,只能充分利用文件名或者文本格式以及文本本身实现数据的搜索功能。因此,一定程度的定制或者增强对于充分利用 Google Drive云储存功能是非常有必要的。
搜索PDF文件比搜索MP3和JPEG 要容易一些,但是Google Drive对PDF文件的搜索有一定的局限性。例如,你可以扫描一张发票和银行对账单,并将其保存为PDF。即使是你用带有OCR功能的扫描仪或者软件提取文本,但你仍然无法以一种可靠的方式搜索该文件。文本中可能包含了公司名称和日期,但是可能缺少用于查找和归档的关键字,如 "bank", "insurance"以及"paid with PayPal" 等。这些正是你保存PDF文件时需要包含在关键字元数据中的信息,但是Google Drive在搜索索引中没有使用该元数据。因此,你可以使用LEADTOOLS PDF SDK 读取和编辑元数据,然后更新Google Drive中文件的IndexableTextData属性。
接下来,我们将展示如何读取和编辑PDF文档中的元数据关键字,更新Google Drive中的文件,链接本地Google Drive数据库等。
创建上下文菜单(右键菜单)
Google Drive的服务配备了桌面应用程序,可将文件自动同步到带有在线云驱动的电脑上。另外方法就是添加上下文菜单。当右键点击PDF文件时,在所弹出的上下文菜单中,选择"Update File Keywords",将文件名作为参数传递到应用程序中。
using (RegistryKey pdfTypeRegKey =
Registry.ClassesRoot.OpenSubKey(".pdf"))
{
// Create path to registry location
string regPath = string.Format(@"{0}\shell\{1}",
(String)pdfTypeRegKey.GetValue(null), "UpdateFileKeywords");
// Add context menu to the registry
using (RegistryKey key = Registry.ClassesRoot.CreateSubKey(regPath))
{
key.SetValue(null, "Update File Keywords");
}
// Add command that is invoked to the registry
string menuCommand = string.Format("\"{0}\" \"%L\"",
Application.ExecutablePath);
using (RegistryKey key = Registry.ClassesRoot.CreateSubKey(
string.Format(@"{0}\command", regPath)))
{
key.SetValue(null, menuCommand);
}
}

利用LEADTOOLS更新PDF文档元数据关键字
LEADTOOLS拥有全面的PDF阅读,PDF编辑功能,允许直接修改PDF文件属性,搜索文本,书签等。当根据右键菜单的shell命令加载应用程序时,LEADTOOLS PDFFile对象将检索关键词,并将关键词显示在文本框进行编辑。
PDFFile _document = new PDFFile(fileName, password); _document.Load(); _txtKeywords.Text = _document.DocumentProperties.Keywords;
保存就是这样简单,只需几行代码即可。正如所看到的,PDF文档属性已经更新。
_document.DocumentProperties.Keywords = _txtKeywords.Text; _document.SetDocumentProperties(fileName);

更新Google Drive
在PDF文件中的关键字和其他元数据属性是非常有用而强大的功能,但是Google Drive在其搜索算法中并不它们。Google Drive中每个文件的IndexableTextData属性都可以在使用Google Drive API时进行修改。
当使用 Google Drive桌面应用程序同步应用程序时,它使用本地SQL数据库来跟踪本地文件和在线信息。要实现该操作,我们必需获取能匹配所更新的本地文件的字段。根据Google Drive文件夹的不同结构,你可能需要添加一些额外的查询以找到子文件夹中的文件。然而,一旦你获取了与PDF文件匹配的 inode_number, 你便可以从数据库中获取字段,并调用Google Drive的Web服务。
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@hmdbvip.cn
文章转载自:慧都控件网



自2007年以来,GeoLogismiki一直使用TeeChart Pro VCL/FMX图表库将复杂的数据转化为清晰、交互式的图形。
近日,国产化文档开发组件Spire.Office 同步更新 .NET和 Java 版本至10.10.0 !本次更新带来了多项全新功能与性能优化,为开发者提供更强大、更高效的文档、表格、PDF、演示文稿处理能力。
通过将 ActiveReportsJS Web报表设计器无缝集成到Vue项目,能实现最终用户自助设计/编辑报表,彻底告别依赖开发的繁琐流程。
在日益复杂的数字化转型背景下,企业架构治理已成为确保IT投资与业务战略保持一致、管控技术债务和保障系统质量的关键领域。Sparx Systems Enterprise Architect作为一款基于UML的综合性建模平台,为企业提供了强大的能力,用以定义、传播和执行架构治理框架与标准,从而在整个组织范围内维护架构的一致性与合规性。
相关产品
20多年的老牌图像处理控件,支持TWAIN扫描、200多种图像效果、150多种图像格式…
LEADTOOLS Document Suite Developer ToolkitLEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。
LEADTOOLS Document Imaging Developer Toolkit多语言的文档图像处理控件,支持光符识别处理、条形码扫描识别等。
LEADTOOLS Imaging HTML5 ModuleLEADTOOLS Imaging HTML5 Module帮您开发强健、轻量级的跨平台图像应用程序
最新文章 MORE
永利最大(官方)网站相关的文章 MORE
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@hmdbvip.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
永利最大(官方)网站