• Um raspador da web extrai informações relevantes de um site, apresentando-as de forma organizada. A maioria das aplicações deste tipo só pode visar sites específicos, mas qualquer Raspador de sites é um pouco diferente. Esta aplicação em particular permite-lhe construir scripts rastejantes a partir do zero, entregando um raspador personalizável do site para atender às necessidades de qualquer usuário. Trabalhando com Anysite Raspador não é tão difícil uma vez que você pegar o jeito dele, mas note que, na primeira, você pode precisar de tomar o tempo para ler as instruções na documentação e assista os tutoriais em vídeo de perto para entender como tudo funciona, especialmente desde que o desenvolvedor não oferece suporte para a criação de um projeto de script. Existem vídeos online que mostram como tudo funciona passo a passo, tanto com um vídeo de projeto de perfil curto e um vídeo de projeto de perfil detalhado. Há um conjunto de raspadores de amostra que você pode baixar a partir de dentro da aplicação e usá-los livremente, mas o construtor de raspador do site permite-lhe criar o script crawling você mesmo usando XPath. O Construtor possui um navegador integrado que você pode usar para visualizar a página a rastejar.  Você começa a definir tudo, desde a URL à pesquisa, as colunas a serem extraídas e os itens a ignorar durante a análise. Além disso, o construtor pode ser configurado para deslocar automaticamente a página antes da extracção ou ao carregar a página seguinte. Para o ajudar a definir os campos a extrair, o Anysite Scraper fornece um selector de campos HTML que lhe permite ver o XPath encontrado, bem como o texto extraído e os dados HTML. Os campos podem ser facilmente gerenciados: você pode definir seus atributos, selecionar seus pais e irmãos, Configurar Opções de indexação, e muito mais. Qualquer Raspador de sites oferece a plataforma para ajudá-lo a criar seus próprios scripts de raspagem web e usá-los com suas páginas web alvo. O objetivo é ajudá-lo a extrair automaticamente dados relevantes da web e informações de contatos comerciais, tais como o nome da empresa, seu site, informações de contato e endereço, e-mail, horário de trabalho, e assim por diante. Todos estes detalhes podem ser exportados para o formato Excel ou CSV. É aconselhável testar o aplicativo com o site que você quer rastejar, como e não garante que todos os sites são suportados. Por exemplo, não funciona com o LinkedI ou o Google Maps.
  • Bir web kazıyıcı, bir web sitesinden ilgili bilgileri çıkarır ve bunları düzenli bir şekilde sunar. Bu türdeki çoğu uygulama yalnızca belirli web sitelerini hedefleyebilir, ancak Anysite Scraper biraz farklıdır. Bu özel uygulama, herhangi bir kullanıcının ihtiyaçlarını karşılamak için özelleştirilebilir bir web sitesi kazıyıcı sunarak, sıfırdan tarama komut dosyaları oluşturmanıza olanak tanır. Anysite Scraper ile çalışmak, bir kez alıştıktan sonra o kadar da zor değil, ancak ilk başta, her şeyin nasıl çalıştığını anlamak için dokümantasyondaki talimatları okumak ve video eğitimlerini yakından izlemek için zaman ayırmanız gerekebileceğini unutmayın, özellikle geliştirici bir proje komut dosyası oluşturmak için destek sunmaz. Hem kısa bir profil proje videosu hem de ayrıntılı bir profil proje videosu ile her şeyin nasıl çalıştığını adım adım gösteren çevrimiçi videolar var. Uygulama içinden indirip özgürce kullanabileceğiniz bir dizi örnek kazıyıcı vardır, ancak web sitesi kazıyıcı oluşturucu, tarama komut dosyasını XPath kullanarak kendiniz oluşturmanıza olanak tanır. Oluşturucu, taranacak sayfayı önizlemek için kullanabileceğiniz entegre bir tarayıcıya sahiptir. Analiz sırasında aranacak URL’den, çıkarılacak sütunlardan ve yok sayılacak öğelerden her şeyi tanımlayabilirsiniz. Ayrıca, oluşturucu, çıkarma işleminden önce veya sonraki sayfayı yüklerken sayfayı otomatik olarak kaydıracak şekilde yapılandırılabilir. Ayıklanacak alanları tanımlamanıza yardımcı olmak için Anysite Kazıyıcı, bulunan xPath'in yanı sıra çıkarılan metni ve HTML verilerini görmenizi sağlayan bir HTML alan seçicisi sağlar. Alanlar kolaylıkla yönetilebilir: niteliklerini tanımlayabilir, ebeveynlerini ve kardeşlerini seçebilir, indeksleme seçeneklerini yapılandırabilir ve daha fazlasını yapabilirsiniz. Anysite Scraper, kendi web kazıma komut dosyalarınızı oluşturmanıza ve bunları hedef web sayfalarınızla kullanmanıza yardımcı olacak platformu sunar. Amaç, ilgili web verilerini ve işletme adı, web sitesi, iletişim bilgileri ve adresi, e-posta, çalışma saatleri vb. Gibi önemli bilgileri otomatik olarak çıkarmanıza yardımcı olmaktır. Tüm bu ayrıntılar Excel veya CSV formatında dışa aktarılabilir. Uygulamayı, taramak istediğiniz web sitesiyle test etmeniz önerilir ve bu, tüm web sitelerinin desteklendiğini garanti etmez. Örneğin LinkedI veya Google Haritalar ile çalışmaz.
  • A web scraper extracts relevant information from a website, presenting it in an organized manner. Most applications of this kind can only target specific websites but Anysite Scraper is a bit different. This particular application enables you to build crawling scripts from scratch, delivering a customizable website scraper to meet the needs of any user.

    Working with Anysite Scraper is not so difficult once you get the hang of it but note that, at first, you might need to take the time to read the instructions in the documentation and watch the video tutorials closely to understand how everything works, especially since the developer offers no support for creating a project script. There are online videos that show you how everything works step by step, both with a short profile project video and a detail profile project video.

    There is a set of sample scrapers that you can download from within the application and use them freely but the website scraper builder enables you to create the crawling script yourself using XPath. The Builder features an integrated browser that you can use to preview the page to crawl.  You get to define everything from the URL to search, the columns to be extracted and the items to ignore during the analysis. Furthermore, the builder can be configured to automatically scroll the page before extraction or when loading the next page.

    To help you define the fields to extract, Anysite Scraper provides a HTML field selector that enables you to see the found xPath, as well as the extracted text and HTML data. Fields can be easily managed: you can define their attributes, select their parents and siblings, configure indexing options, and more.

    Anysite Scraper offers the platform to help you create your own web scraping scripts and use them with your target webpages. The purpose is to help you automatically extract relevant web data and business leads info, such as the business name, its website, contact information and address, email, working hours, and so on. All these details can be exported to Excel or CSV format.

    It is advisable you test the application with the website you want to crawl, as and it does not guarantee that all websites are supported. For instance, it doesn’t work with LinkedI or Google Maps.