最近项目中涉及到浏览器整页截屏的功能,有点复杂,研究了一天,终于在IE浏览器下实现,至于其他浏览器,以后再研究。
所谓整页截屏,就是说把整个页面全部截进去,包括通过滚动才能看到的部分。
在网上搜了一下,大家用的都是同一种办法:通过滚动页面,截取每一屏的图片,然后再合并成一张整的图片。
方法是好的,悲催的是,没有一个代码是能正常运行的,相信很多人都有同感!没办法,自己动手,丰衣足食。
我需要用.NET来实现。分析一下,主要有以下几个技术点:
1、如何取得浏览器对象。首先要确定IE版本,我用的是IE8浏览器,对象结构和IE6、IE7有点区别。这个可以通过Win32API中的FindWindow函数来实现。
2、对指定控件截屏。这个可以通过Win32API中的PrintWindow函数来实现,这个函数有一个优点:即使浏览器被其它窗口挡住,也可以正常截屏。但是,如果浏览器窗口最小化了,那就漆黑一片了。。。
3、合并图片。这个用GDI+可以很方便地实现。在内存中创建一个大的画布,然后将图片从上至下依次画上去即可。
开始动手。
首先,创建一个Console应用程序(用Form程序也没关系)。
(1)添加对System.Drawing和System.Windows.Forms的引用。
(2)添加对两个COM组件的引用:SHDocVw、MSHTML,并设置属性“嵌入互操作类型”为False(这个很重要,否则无法接下来的程序无法编译通过)。
(3)将程序入口Main方法标记为[STAThread](这个也很重要,否则接下来的程序会运行失败)。
然后,加入Win32API类,该类对几个重要的API进行了封装,接下来我们会用到这些API。代码如下:
using System;
using System.Runtime.InteropServices;
namespace IECapture
{
/// <summary>
/// Win32API封装类。
/// </summary>
internal static class Win32API
{
//User32
[DllImport("User32.dll")]
public static extern int FindWindow(string lpClassName, string lpWindowName);
[DllImport("user32.dll", SetLastError = true)]
public static extern IntPtr FindWindowEx(IntPtr parentHandle, IntPtr childAfter, string className, IntPtr windowTitle);
[DllImport("user32.dll")]
public static extern IntPtr GetWindowRect(IntPtr hWnd, ref RECT rect);
[DllImport("user32.dll")]
public static extern IntPtr GetWindowDC(IntPtr hWnd);
[DllImport("User32.dll")]
public static extern bool PrintWindow(IntPtr hwnd, IntPtr hdcBlt, int nFlags);
//gdi32
[DllImport("gdi32.dll")]
public static extern bool BitBlt(IntPtr hObject, int nXDest, int nYDest, int nWidth, int nHeight, IntPtr hObjectSource, int nXSrc, int nYSrc, int dwRop);
[DllImport("gdi32.dll")]
public static extern IntPtr CreateCompatibleBitmap(IntPtr hDC, int nWidth, int nHeight);
[DllImport("gdi32.dll")]
public static extern IntPtr CreateCompatibleDC(IntPtr hDC);
[DllImport("gdi32.dll")]
public static extern bool DeleteDC(IntPtr hDC);
[DllImport("gdi32.dll")]
public static extern bool DeleteObject(IntPtr hObject);
[DllImport("gdi32.dll")]
public static extern IntPtr SelectObject(IntPtr hDC, IntPtr hObject);
public struct RECT
{
public int left;
public int top;
public int right;
public int bottom;
}
}
}
最后,加入主程序。代码逻辑如下:
(1)获取当前IE浏览器对象。
(2)获取浏览器核心控件的矩形区域,计算整个页面一共有多少屏。
(3)通过滚动窗口的方式,对每一屏的页面进行截屏。
(4)将所有图片合并为一张整的图片。
主程序的源代码如下:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Drawing;
using System.Windows.Forms;
namespace IECapture
{
class Program
{
//必须指定COM线程模型为单线程
[STAThread]
static void Main(string[] args)
{
//获取浏览器对象
SHDocVw.ShellWindows shellWindows = new SHDocVw.ShellWindowsClass();
var webBrowser = shellWindows.Cast<SHDocVw.WebBrowser>().FirstOrDefault(c => c.Name == "Windows Internet Explorer");
if (webBrowser == null)
{
Console.WriteLine("当前未打开任何IE浏览器");
Console.ReadLine();
return;
}
//查找浏览器核心控件
IntPtr childHandle1 = Win32API.FindWindowEx(new IntPtr(webBrowser.HWND), IntPtr.Zero, "Frame Tab", IntPtr.Zero);
IntPtr childHandle2 = Win32API.FindWindowEx(childHandle1, IntPtr.Zero, "TabWindowClass", IntPtr.Zero);
IntPtr childHandle3 = Win32API.FindWindowEx(childHandle2, IntPtr.Zero, "Shell DocObject View", IntPtr.Zero);
IntPtr childHandle4 = Win32API.FindWindowEx(childHandle3, IntPtr.Zero, "Internet Explorer_Server", IntPtr.Zero);
if (childHandle4 == IntPtr.Zero)
{
Console.WriteLine("当前未打开任何IE浏览器");
Console.ReadLine();
return;
}
//获取浏览器核心控件的矩形区域
Win32API.RECT rc = new Win32API.RECT();
Win32API.GetWindowRect(childHandle4, ref rc);
int pageHeight = rc.bottom - rc.top;
//获取HTML文档对象
mshtml.IHTMLDocument2 htmlDoc = (mshtml.IHTMLDocument2)webBrowser.Document;
//计算总共有多少页,以及最后一页的高度
int pageCount = htmlDoc.body.offsetHeight / pageHeight;
int lastPageHeight = htmlDoc.body.offsetHeight % pageHeight;
if (lastPageHeight > 0) pageCount++;
int scrollBarWidth = pageCount > 1 ? SystemInformation.VerticalScrollBarWidth : 0;
//图片列表,用于放置每一屏的截图
List<Image> pageImages = new List<Image>();
//一页一页地滚动截图
htmlDoc.parentWindow.scrollTo(0, 0);
for (int pageIndex = 0; pageIndex < pageCount; pageIndex++)
{
using (Image image = CaptureWindow(childHandle4))
{
//去掉边框,以及垂直滚动条的宽度
Rectangle innerRect = new Rectangle(2, 2, image.Width - scrollBarWidth - 4, image.Height - 4);
if (pageCount > 1 && pageIndex == pageCount - 1 && lastPageHeight > 0)
innerRect = new Rectangle(2, pageHeight - lastPageHeight + 2, image.Width - scrollBarWidth - 4, lastPageHeight - 4);
pageImages.Add(GetImageByRect(image, innerRect));
}
htmlDoc.parentWindow.scrollBy(0, pageHeight);
}
//拼接所有图片
Image fullImage = MergeImages(pageImages);
if (fullImage == null)
{
Console.WriteLine("截屏失败,未获得任何图片");
Console.ReadLine();
return;
}
//将截屏图片保存到指定目录
try
{
string fileName = @"c:\IE整屏截图.png";
fullImage.Save(fileName);
Console.WriteLine("截屏成功,图片位置:" + fileName);
}
finally
{
fullImage.Dispose();
}
Console.ReadLine();
}
/// <summary>
/// 合并图片。
/// </summary>
/// <param name="imageList">图片列表。</param>
/// <returns>合并后的图片。</returns>
static Image MergeImages(List<Image> imageList)
{
if (imageList == null || imageList.Count == 0) return null;
if (imageList.Count == 1) return imageList[0];
int pageWidth = imageList[0].Width;
int totalPageHeight = imageList.Sum(c => c.Height);
Bitmap fullImage = new Bitmap(pageWidth, totalPageHeight);
using (Graphics g = Graphics.FromImage(fullImage))
{
int y = 0;
for (int i = 0; i < imageList.Count; i++)
{
g.DrawImageUnscaled(imageList[i], 0, y, imageList[i].Width, imageList[i].Height);
y += imageList[i].Height;
imageList[i].Dispose();//释放图片资源
}
}
return fullImage;
}
/// <summary>
/// 获取图片的指定区域。
/// </summary>
/// <param name="image">原始图片。</param>
/// <param name="rect">目标区域。</param>
/// <returns></returns>
static Image GetImageByRect(Image image, Rectangle rect)
{
if (image == null || rect.IsEmpty) return image;
Bitmap bitmap = new Bitmap(rect.Width, rect.Height);
using (Graphics g = Graphics.FromImage(bitmap))
{
g.DrawImage(image, 0, 0, rect, GraphicsUnit.Pixel);
}
return bitmap;
}
/// <summary>
/// 为指定窗口或控件截屏。
/// </summary>
/// <param name="hWnd">句柄。</param>
/// <returns>截屏图片。</returns>
static Image CaptureWindow(IntPtr hWnd)
{
IntPtr hscrdc = Win32API.GetWindowDC(hWnd);
if (hscrdc == IntPtr.Zero) return null;
Win32API.RECT windowRect = new Win32API.RECT();
Win32API.GetWindowRect(hWnd, ref windowRect);
int width = windowRect.right - windowRect.left;
int height = windowRect.bottom - windowRect.top;
IntPtr hbitmap = Win32API.CreateCompatibleBitmap(hscrdc, width, height);
IntPtr hmemdc = Win32API.CreateCompatibleDC(hscrdc);
Win32API.SelectObject(hmemdc, hbitmap);
Win32API.PrintWindow(hWnd, hmemdc, 0);
Image bmp = Image.FromHbitmap(hbitmap);
Win32API.DeleteDC(hscrdc);
Win32API.DeleteDC(hmemdc);
return bmp;
}
}
}
【总结】
要想写一个好的整页截屏程序,还是很困难的。就拿本文的程序来说,就存在以下几点不足之处:
(1)仅在IE8浏览器上测试通过,无法在FireFox、Chrome上运行。即使同是IE家族的IE6、IE7、IE9,我也不敢保证能正常运行,各位同学可以测试一下,并尝试修改,欢迎交流。
(2)如果有浮动DIV随着页面一起滚动,在每一屏上都会被截屏。
(3)未考虑水平滚动条的影响。
(4)未考虑在多线程环境下的应用。
最后附上一个cnblogs.com首页的截屏,看看效果:)
分类: 实用程序