Beranda > Programming, Website > Cara mengambil konten dari sebuah HTML menggunakan regex

Cara mengambil konten dari sebuah HTML menggunakan regex

Berawal dari skripsi, berlanjut dengan berbagi…hehe…
nah, ini sedikit tutorial singkat cara mengambil sebagian konten dari sebuah halaman website.
Berikut ini source code fungsi untuk melakukan parsing untuk mengambil sebagian konten dari sebuah halaman website.

function parse_isi($isi, $awal,$akhir,$content_only=FALSE)
{
	$found = preg_match('#<'.$awal.'>(.*?)<'.$akhir.'>#s', $isi, $matches);
	if ($found != false) 
	{
		if ($content_only) 
		{
			return trim($matches[1]);  //ignore the enclosing tags
		} 
		else 
		{
			return trim($matches[0]);  //return the full pattern match
		}
	}
	return false;
}

Nah, cara menggunakan nya simple kog, misal nih kita mau mengambil konten seperti di bawah ini: *konten di bawah ini di masukkan ke dalam $isi*

	<div id="ambil">
		ini sebuah div
	</div>

maka, parameter fungsi nya:
$awal = ‘div id=”ambil”‘;
$akhir = ‘/div’;
$content_only adl parameter apakah kita juga akan mengambil tag $awal dan tag $akhir.

yap…semoga berguna bagi anda sekalian..

regard,
sebastian88

Iklan
  1. Juni 28, 2011 pukul 7:00 pm

    Makasih gan ilmunya… baca-baca dulu ah… 😀

    • Juni 28, 2011 pukul 9:56 pm

      okey deh…:d silahkan leave comment kalo ada yang mau di tanyakan..:D

  2. dm
    Juli 4, 2011 pukul 11:47 am

    Tanya:
    didalam function parse_isi nya ada parameter $link, kemudian parameter $link itu kok gak diapa2in 😀

    • Juli 4, 2011 pukul 4:22 pm

      thx koreksi nya…:D
      $isi adalah konten HTML yang sudah di string kan…:D
      itu $isi seharus nya…*karna edit dari fungsi skripsi ku…:D mungkin kelewatan…
      thx thx

  3. September 3, 2011 pukul 8:31 pm

    Maap nie gan.. ane msih newbie dalam hal HTML maupun PHP.

    bisa berikan sample nya ngk?? biar lebih jelas hasil nya.?

    tq

  1. No trackbacks yet.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s

%d blogger menyukai ini: