- Автор темы
- #1
дана страница:
задача:
- вытащить только таблицу с класcом main
- удалить все теги <img>
- удалить все ссылки, но текст оставить
Т.е. должно остаться:
HTML:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
<title>Untitled Document</title>
</head>
<div class="separator"><i></i>
</div>
<div id="sinlgepage">
<div id="artbody">
<div class="separator"><i></i></div>
<div class="simple_body_0pad margin_bottom_20">
<table class="main">
<tr>
<td><a href="1.html">text1</a></td>
<td><a href="2.html">text2</a></td>
</tr>
<tr>
<td><a href="3.html">text3</a></td>
<td><img src="1.jpg" border="0" alt="1" /></td>
</tr>
</table>
<table class="none">
<tr>
<td><a href="1.html">text1</a></td>
<td><a href="2.html">text2</a></td>
</tr>
<tr>
<td><a href="3.html">text3</a></td>
<td><img src="1.jpg" border="0" alt="1" /></td>
</tr>
</table>
</div> <!-- artbody -->
<div class="separator"><i></i></div>
<body>
</body>
</html>
- вытащить только таблицу с класcом main
- удалить все теги <img>
- удалить все ссылки, но текст оставить
Т.е. должно остаться:
HTML:
<table class="main">
<tr>
<td>text1</td>
<td>text2</td>
</tr>
<tr>
<td>text3</td>
<td></td>
</tr>
</table>