Netbackup ‘ da senelerdir uğraştıran MSSQL yedeğinde yarıda kesilme problemi ve çözümü

Netbackup kullanmaya başladım başlayalı bir yarıda kesilme problemidir, gidiyordu. Açılan caseler, yapılan çalışmalar fayda vermiyordu ki en son yurt dışından gelen mühendis kök sebebi tam olarak bulamasada bir çözüme kavuşturdu. Ben çektim, siz çekmeyin. Buyrun çözüm:

Read More


interrupt when backup large SQL databases

netbackup appliance test results

 

Yaptığımız tüm testlere rağmen 3 ay boyunca problem networkten dediler, en son sunucu ile netbackup appliance’i arka arkaya bağlayınca yukardaki sonuç göründü.  Bundan sonraki aşamada bulunanları bir sonraki makalede yazacağım.

Link: http://www.symantec.com/connect/forums/interrupt-when-backup-large-sql-databases


Symantec Netbackup ile problem çözüm şekli (How figure out problems Symantec Netbackup support Team)

Son 2.5 senedir benzer problemler ile aylarca aşağıdaki döngüde uğraşırken şimdi aynı döngüye hafta mertebesinde girdiğim için yazma ihtiyacı hissettim.

  1. Client, media server ve master server üzerinde log aç, tekrar dene ve logları gönder.
  2. Timeout değerlerini yükselt
  3. Olmaz ise 2. adıma dön ve daha da yükselt, eğer 7200 sn gibi çok yüksek bir değer çıktı ise 4. adıma geç.
  4. networkde problem var, farklı problemler ile network üzerinde problem olup olmadığını kontrol et.
  5. Media server(appliance) üzerinde bilmemne parametresini değiştir.
  6. Client üzerinde TCPbilmemne parametresini değiştir.
  7. Advanced diske yedek al. Büyük bir ihtimalle başarılı yedek alırsınız ve tekrardan networkde problem var diyip oraya yoğunlaşabilirler.  Yani 4. adıma dönebilirsiniz 🙂
  8. Halen çözülemedi ise başkasına ve backlinedaki birine problemi ata ve 1. adıma geri dön.

Evet arkadaşlar adımlar bu şekilde aylarca hatta yıllarca uğraşmak istiyorsanız case açın, yoksa kendinizce bir çözüm bulun. Mesela MSSQL yedeği kendi üzerinden SQL script ile bir yere native dosya yedeği almak ve sonrasında bu dosya yedeğini netbackup ile yedeklemek gibi. Şimdiden kolay gelsin.

 Not: Bilmiyenleri için söyleyeyim, Netpbackup appliance üzerinde iki tip disk var biri tekilleştirme yapılan Puredisk diğeride direk yazılan Advancedisk. Tekilleştirme yapıldığında hata alınıyor ve yapılmadığında hata alınmıyor ise problem tekilleştirme yapılan taraf ile ilgil olduğunu anlamak için mühendis bile olmaya gerek yok. Fakat bunu görmelerine rağmen inatla problem networkte diyenler çok kötü destek verdiğini gösterir.

___________________________________________________________

 

1 Open the Client, media and master server logs , try again and send the logs .

2 Increase timeout values.

3 If problem doesn’t resolve go step 2 again , if timeout  value come over 7200 second, go 4 step now .

4 Symantec engineers say “you have network problems” , check the network .

5 Change the some media server ( appliance ) parameters

6 Change the client TcpWhatever  parameters and reboot the client .

7 Take backup to Advanced  disk. And probably you can take successfully backup to advanced disk and Symantec engineers can say “you have network problems” 🙂 again

8 If the problem still not resolved the problem, assign case to another engineer or backline and go step 1

In this way, If you want to deal with these steps  for months or even years, open a case , or found a solution by yourself . For example, you can take MSSQL native backup, then backup this file with NetBackup . Good Luck.


Symantec netbackup appliance problemleri

Eğer Symantec Apliance almayı düşünüyorsanız, karşılacağınız problemler aşağıdaki gibi olacaktır. Bunlardan bir kısmı gündelik, bir kısmı haftalık ve aylık olanlar mevcuttur. Detaylı bilgi için benimle iletişime geçebilirsiniz.

•Diske yazma ve ya diskten okuma hatası: Yoğunluktan ve ya bu nedeni ile kısa süreliğine diskin «down» konuma geçmesinden kaynaklanmakta.
•Diskin kullanılmaz hale gelmesi: Bazen diskin «down» konuma geçerek yeniden başlatılana kadar bu şekilde kalması.
•Diskten kasete kopyalama yapılamaması: Yukardaki sebeplerden ötürü ve ya bir şekilde katalogdaki sunucu adı ile netbackup politikası içeriğinde görünen sunucu adı arasında küçük-büyük harf farkı var ise ilk diske yazma yapılmasına rağmen diskten kasete yazamamakta.
•Disklerin ayda bir yavaşlaması: Disk yazma önbelleğine bağlı olan bataryanın ayda bir boşaltılıp doldurulması nedeni ile önbelleğin etkisiz hale gelmesi ve yazma işleminin birkaç günlüğüne aşırı yavaşlama problem.
•Replikasyonun belirtilen şekilde optimize çalışmaması, ve hiç tamamlanamaması.
•Cihazlar üzerindeki güncelleme, yama yükleme ve bakım işlemlerinde uzun süreli problemler yaşanması.

How to find orphaned images on disk for netbackup? ( dedup disk or advanced disk full problem )

If you believe that the disk is too full that should be more than normally.(I had this problem on 3 netbackup 5220 appliance that version 2.5.2 and 2 windows media server that version 7.5.0.5, I found and deleted them,then 50TB space was freed from dedup disks of three apliances.) We need a bpimmedia list from the master server, and catalog lists from the deduplication media servers to compare and find out if there are orphaned images. Follow the steps below:

1) Identify the disk pool name and then collect NetBackup Image list from the Master Server:

For Windows master server:-

<install path>\veritas\Netbackup\bin\admincmd\bpimmedia -stype PureDisk -dp <POOLNAME> >c:\NBU_Images.txt

or for UNIX master server:-

/usr/openv/netbackup/bin/admincdmd/bpimmedia -stype PureDisk -dp <POOLNAME> >/tmp/NBU_Images.txt

 

2) Gather deduplication image list (replace “mediaservername” in the commands below with the actual media server name)

a) For Windows MSDP storage server:

Change to “<STORAGE_LOCATION>\databases\catalog” folder and run:

dir /b /s /a-d |findstr /vi “__” >c:\DEDUPE_IMAGES-mediaservername.txt

 b) For Unix MSDP storage server change to “<STORAGE_LOCATION>/databases/catalog” and run:

find -not -name “__*__*” -type f >/tmp/DEDUPE_IMAGES-mediaservername.txt

3) Compare output files NBU_Images.txt and DEDUPE_IMAGES.txt files.

If you find extra image names in NBU_Images.txt, so, you have orphaned images.

Create a technical case in my.symantec.com or contact me to delete these images.

Regards.


Symantec Netbackup Appliance Boot order

Bizdeki Netbackup 5220 appliance i geçtiğimiz hafta yeniden başlatmış idim, bir problem yoktu. Ve bu hafta yine yeniden başltayım dedim ama açılmadı. Nedeni ise biosta boot order değişmiş. Case ile ilgilenen mühendisin söylediğine göre dışardan bir disk bağlandığında boot order değişebiliyormuş. Bende son 3-4 gün içinde VM image yedeklerini SAN üzerinden almak için veri depolama cihazı üzerindeki yeni eklediğimiz LUNları göstermiş idim.

Sonuç olarak çözüm için biosta görünen boot order şu şekilde olacak:


Backup failed with Status Code 1, 2, 6, 13, 24, 42

Problem:

If backups failed with Status Code 1, 2, 6, 13, 24, 42 at peak times that backed up with Netbackup 52xx Appliance and you can’t find a reasonable solution.

Error:

status: 23: socket read failed
socket read failed: errno = 62 - Timer expired
 socket read failed: errno = 104 - Connection reset by peer
network connection broken(40)

Cause:

As it can be seen in the logs, there is a network problem. If you use balance-alb protocol to bond ethernet ports of appliance, you must change bonding protocol.

Read More