提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:何跃|2022-01-24 14:36:15.267|阅读 266 次
概述:PDF文件可以被用来存储文件、图像和其他数据。在过去,人们问是否有一个简单的方法从PDF文件中提取图形,如图表或照片。如果你想从一个PDF文件中获取所有的图像,或者有数百个或更多的PDF文件需要处理,那么答案就是使用LEADTOOLS。
#慧都22周年庆大促·界面/图表报表/文档/IDE/IOT/测试等千款热门软控件火热促销中>>
使用LEADTOOLS提取嵌入在PDF文件中的图像很容易。下面是使用LEADTOOLS从PDF文件中提取图像的C#、Java和PowerShell代码样本。
/// <summary>
/// 提取PDF文档为TIFF
/// </summary>
/// <param name="pdfPath"></param>
private static void ExtractImagesFromPdf(string pdfPath)
{
var destinationPath = Path.Combine(Path.GetDirectoryName(pdfPath), @"images\");
var documentName = Path.GetFileNameWithoutExtension(pdfPath);
using var pdfDocument = new PDFDocument(pdfPath);
pdfDocument.ParsePages(PDFParsePagesOptions.Objects, 1, -1);
foreach (var page in pdfDocument.Pages)
{
var embeddedImages = page.Objects.Where(o => o.ObjectType == PDFObjectType.Image).ToArray();
using var codecs = new RasterCodecs();
foreach (var imgObj in embeddedImages)
{
var destinationFilePath = destinationPath + documentName + "~page-" + page.PageNumber + "~" + imgObj.ImageObjectNumber + ".tif";
using var image = pdfDocument.DecodeImage(imgObj.ImageObjectNumber);
codecs.Save(image, destinationFilePath, RasterImageFormat.TifLzw, image.BitsPerPixel, 1, 1, -1, CodecsSavePageMode.Append);
}
}
}
/**
* 提取PDF文件并另存为到子目录
* e.g. getFileName("c:\\temp\\") will return "c:\\temp\\images\\"
*
*
* @param pdfPath
*/
private static void extractImagesFromPdf(String pdfPath) {
final String destinationFolder = getOutputFolder(pdfPath);
final String documentName = getBaseName(getFileName(pdfPath));
final PDFDocument pdfDocument = new PDFDocument(pdfPath);
pdfDocument.parsePages(PDFParsePagesOptions.OBJECTS.getValue(), 1, -1);
final RasterCodecs codecs = new RasterCodecs();
try {
final List<PDFDocumentPage> pages = pdfDocument.getPages();
for (PDFDocumentPage page : pages) {
final int pageNumber = page.getPageNumber();
for (final PDFObject object : page.getObjects()) {
if (object.getObjectType() == PDFObjectType.IMAGE) {
final String imageObjectNumber = object.getImageObjectNumber();
final String destinationFilePath = destinationFolder + documentName + "~page-" + pageNumber + "~"
+ imageObjectNumber + ".tif";
final RasterImage image = pdfDocument.decodeImage(imageObjectNumber);
try {
codecs.save(image, destinationFilePath, RasterImageFormat.TIFLZW, image.getBitsPerPixel(),
1, 1, -1, CodecsSavePageMode.OVERWRITE);
} finally {
image.dispose();
}
}
}
}
} finally {
codecs.dispose();
}
}
function Export-LtImagesFromPdf {
<#
.SYNOPSIS
Exports images embedded in a PDF file
.DESCRIPTION
Exports images embedded in a PDF file
.PARAMETER PdfPath
File path to the PDF file that has embedded images to be exported
.PARAMETER Path
Folder path to export the embedded images
.EXAMPLE
Export-LtImagesFromPdf -PdfPath "c:\temp\a.pdf" -Path "c:\temp\images\"
.INPUTS
String
.OUTPUTS
void
.NOTES
Author: LEAD Technologies, Inc.
Website: //www.leadtools.com
Twitter: @leadtools
#>
[CmdletBinding()]
param(
[Parameter(Mandatory)]
[string]$PdfPath,
[Parameter(Mandatory)]
[string]$Path
)
if( -not(Test-Path -Path $PdfPath -PathType Leaf) ) {
Write-Error "File does not exist."
return $false
}
if( -not(Test-Path -Path $Path -PathType Container) ) {
New-Item -Path $Path -ItemType Directory
}
$baseFileName = (Get-Item $PdfPath).Basename
$pdfDocument = New-Object -TypeName Leadtools.Pdf.PDFDocument -ArgumentList $PdfPath
$pdfDocument.ParsePages(1, 1, -1)
ForEach ($page in $pdfDocument.Pages){
ForEach($object in $page.Objects){
if( $object.ObjectType -eq [Leadtools.Pdf.PDFObjectType]::Image ){
$imageObjectNumber = $object.ImageObjectNumber
$pageNumber = $page.PageNumber
$image = $pdfDocument.DecodeImage($imageObjectNumber)
$outputFilePath = (Join-Path -Path $Path -ChildPath ($baseFileName + "~page#-" + $pageNumber + "~" + $imageObjectNumber + ".tif"))
Export-LTImage -RasterImage $image -Path $outputFilePath -Format ([Leadtools.RasterImageFormat]::Tif)
}
}
}
}
有了LEADTOOLS的工具包,就没有什么是你不能做的PDF文件了。点击这里可以下载Leadtools全套SDK。
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@hmdbvip.cn




在现代软件开发过程中,自动化单元测试是确保代码质量与可靠性的关键环节。尤其对于特定框架(如MFC)的代码,测试复杂度显著增加,常因依赖外部资源或交互操作而难以在静默环境中顺利执行。Parasoft C/C++test作为专业的软件测试工具,致力于帮助开发团队高效实施自动化测试,通过其强大的桩函数功能,能够有效模拟依赖组件的行为,从而实现对复杂逻辑的隔离测试。
本文将为大家介绍如何在MyEclipse中使用XDoclet开发EJB 2 Session Bean,欢迎下载最新版体验!
如果能将 CSV 自动转换为 PDF ,就能快速生成清晰、美观的报表,既节省手动排版时间,又能保持数据的专业呈现。本文将介绍如何使用 Spire.XLS for Java 实现这一过程——从加载 CSV 到输出高质量 PDF,仅需数行代码即可完成。
Parasoft C/C++test是一款专为C/C++代码设计的自动化测试工具,通过静态代码分析、单元测试和运行时错误检测等功能,帮助开发团队在早期发现并修复缺陷,提升代码质量和开发效率 。在实际使用中,尤其是在VC6此类旧版开发环境中执行单元测试时,可能会因环境兼容性问题触发链接错误。
相关产品
LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。
最新文章 MORE
永利最大(官方)网站相关的文章 MORE
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@hmdbvip.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
永利最大(官方)网站