Watermark Software 8.2
Giugno 5, 2016 8:39
Watermark Software is a superior all-side photo software, which mainly focuses on safeguarding photos copyrights and photo info privacy. It supports beautifying photos, batch watermarking, editing/deleting EXIF info, converting photo format, and keeps a record of processing 300 photos in 1 min. Program features include Mosaic, Bokeh and many other effects as well as adding frames!
Simple Tutorial here.
Get Lifetime Updates at $17.95 USD (70% OFF)
Source link
What happened in hardware – May 29 to June 4 edition
Giugno 5, 2016 5:51
Nvidia’s been dominating the headlines as of late with its newest graphics cards based on Pascal, but lest anyone forget, there’s a company called AMD that designs GPUs as well. To remind everyone of its presence, AMD announced its first Polaris part, the Radeon RX 480, at a tantalizing price point. Let the GPU wars commence.
Outside of graphics, this past week saw a bevy of product announcements at Computex, along with some awesome case mods, including one with a cotton candy machine attached to it. Talk about a sweet mod!
If you missed any or all of the happenings in the wonderful world of hardware, don’t fret, just sit back and click through the highlights.
AMD Radeon RX 480 shoots for value at $200
Nvidia is clearly going after the high-end GPU market with Pascal GP104 cards, with GTX 1080 and GTX 1070 both delivering better than Titan X levels of performance in our testing. AMD’s response with Polaris 10/11 won’t be direct competition, but instead AMD is going after the mainstream market. We can’t talk about everything we’ve been told right now, but much like what Nvidia did with the GTX 1070, AMD has released a few key details.
Right off the bat, we see plenty of things that tell us about positioning. AMD lists 36 Compute Units, and unless they’re changing things with Polaris, they’ve used 64 ‘shader cores’ in every GCN CU to date, that would be 2304 cores. That’s fewer CUs than the R9 390, but almost 30 percent more than the R9 380. The price is perhaps the most important aspect, however: RX 480 models will start at $199. Presumably that will be the 4GB model, with 8GB models carrying a moderate price premium—somewhere between $20 and $50 would be about right, given current 2GB vs. 4GB pricing.
Digital Storm crams a 10-core CPU and GTX 1080 inside an all-in-one
Digital Storm just went into full-on beast mode for the all-in-one category. Provided you’re willing to pony up the requisite funds, Digital Storm’s new Aura is a killer AIO with a curved 34-inch display that’s packed with the latest hardware options.
“We’re excited to announce the Aura, it’s unlike anything we’ve offered,” said Harjit Chana, Digital Storm’s Chief Operating Officer. “You can now truly have an immersive gaming experience in a slim AIO form factor.”
Chana isn’t kidding. There are four starting configurations to choose from—Good ($1,999), Better ($2,748), Best ($3,127), and Ultimate ($4,998). All four sport the aforementioned 34-inch monitor with a 3440×1440 (WQHD) resolution, but it’s not just the size of the monitor that delivers an immersive experience, it’s the hardware inside.
Gigabyte’s Aero 14 is an ultrabook for gamers
There’s no hard and fast rule that says gaming laptops have to be thick and heavy. Lest there be any doubt, meet Gigabyte’s new Aero 14, a 14-inch ultrabook-like system with gaming chops.
The Aero 14 measures 335mm x 250mm by 19.9mm (WxDxH) and weighs 1.89kg. If that’s all we told you about it, you might assume it’s a thin and light business laptop. And it is, albeit a colorful one that might be a little more attention getting than what you’re comfortable lugging into a board room. But it’s also equipped with discrete graphics—GeForce GTX 965M or 970M—for gaming once you’ve clocked out of work.
Gigabyte’s Aero 14 features a QHD 2560×1440 IPS display powered by Intel Core i7 Skylake CPU options. There are two DDR4 SO-DIMM slots supporting up to 32GB of 2133MHz memory, and room for two M.2 PCI Express Gen3 x4 SSDs.
Asus shows off spectacularly modular gaming PC
Asus today announced what it calls Project Avalon, a gaming PC designed with ease of upgradeability in mind and genuinely sharp looks. But according to the company, Project Avalon goes beyond just appearances. In fact, the entire innards of the system have been completely rethought.
Instead of using any of the existing motherboard form factors, Asus has developed a modular board system that allows users to swap out actual components of the motherboard. Say you want more PCIe slots. Sure; just pop out the expansion daughterboard and swap in another.
Need more IO ports in the rear? Pop out the module for another.Asus developed Project Avalon in conjunction with InWin, which has been making some stellar case designs lately.
Broadwell-E i7-6950X performance preview
‘Wow.’ That was the word that came out of my mouth when I saw the launch information for Intel’s latest enthusiast platform processors, codename Broadwell-E. Going back to the Bloomfield days and LGA1366, Intel has bifurcated their consumer desktop processors into two platforms, one for mainstream users and one for ‘enthusiasts.’ But when Intel says enthusiasts, what they often seem to be saying is “people that have a lot of disposable income.” The first LGA1366 processors (and going back further, the Core 2 and Pentium 4 Extreme Edition processors) defined a new price point for the top-of-the-line parts: $999. That price has basically held steady for more than a decade, all the way to the previous king of the hill, the Core i7-5960X.
If you haven’t guessed yet, Broadwell-E kicks that previous price to the curb, with the new i7-6950X halo part rocking a price tag of $1723—and that’s for bulk 1000 unit orders from Intel. And what exactly does this new monster CPU get you? It gets you 10 cores, two more than the already impressive eight cores on the i7-5960X. It seems Nvidia isn’t the only company going after the magical number 10 these days. Three additional parts round out the Broadwell-E offerings, the 8-core i7-6900K, and the 6-core i7-6850K and i7-6800K. Here’s the quick overview
RAM makers: Samsung makes the best DRAM chips
All major enthusiast memory module makers came out in full force this week at Computex. Corsair, G.Skill, GeiL, and Avexir. I spent a good deal of time talking to all the players and discovered a commonality: all of them indicated that Samsung makes the best memory chips.
I also made the rounds with motherboard manufacturers asking them the same question. Since motherboard makers do compatibility testing with all major memory modules, they also have a good understanding of what works best. Their answer? The same as the module makers.
Samsung, of course, is the leading maker of DRAM chips. But modules can use a variety of different chip makes: Samsung, SK Hynix, Micron, etc.
This cotton candy-making PC is the sweetest case mod
Once upon a time, if you wanted to play PC games and eat cotton candy, you needed two very separate things: a gaming PC and a traveling carnival conveniently passing through town. I guess there are other places you can get cotton candy, but that’s the one I know best. So most of us have gone through life never being able to enjoy these two pleasures at the same time. Leave it to Computex, the best show of the year for elaborate and creative case mods, to come up with the solution: a cotton candy maker PC.
The best case mods from Computex 2016
Computex. The final frontier. The case modder’s mission: to explore strange new methods of water cooling. To seek out new color schemes and new LED components. To boldly go where no modder has gone before.
Ahem. The Enterprise just brings it out in us, you know?
Computex, meanwhile, brings out the best in case modders. All the big component companies sponsor modders to build extravagant systems, which in turn draw awed visitors into their booths to snap pictures and check out the products. It worked on us! We scoured the show floor to find the coolest custom rigs, most of which sport elaborate water cooling systems with intricate hard piping and some equisite lighting and cable management work. The pressure is even higher when you have to build in an open air frame, or fit your parts in the cramped space of a unique shape, like the Enterprise or R2-D2.
Nvidia GeForce GTX 1070 and 1080 coming to gaming notebooks
Speaking with some of our insider contacts at Computex got us some clues for gaming notebooks. Essentially, if you’re in the market for a new gaming notebook, you might want to consider waiting a few months (think August/September). That shouldn’t be too much of a surprise if you follow the gaming notebook industry, but there’s more.
According to our contacts, Nvidia is readying the release of its new 10-series chips for notebooks. The kick is, they won’t be M versions of desktop GPUs. They will be the same chips used on the desktops, just operating at a lower TDP—we’re told there will be the same number of shader units, etc.
Patriot announces 2TB Ignite and budget-friendly Spark SSDs
Patriot has a couple of new solid state drive options, including one that’s aimed at users who want more capacity out of single drive setups, and another that’s intended for budget buyers.
Starting with the former, Patriot added a 2TB capacity option to its Ignite line of SSDs. This is Patriot’s performance family of SATA 6Gbps SSDs, which prior to this new addition topped out at 960GB. Now there’s a model more than twice as big to accommodate growing libraries of games.
Asus launches record breaking ROG Rampage V Edition 10 motherboard
Asus is celebrating the 10th year of its Republic of Gamers (ROG) division with a new flagship motherboard based on Intel’s X99 chipset. It’s the ROG Rampage V Edition 10, a decked board for Haswell-E and Broadwell-E processors that’s already set three world records and 14 global first place finishes in 2D and 3D benchmarks, Asus says.
If it’s bling you’re after, the ROG Rampage V Edition 10 brings it by way of a sleek layout and Aura RGB illumination. There are five independently controlled LED areas on the motherboard, plus a 4-pin RGB header for add-on RGB strips if you want to crank the light show up a notch.
Behind the bling are plenty of high end features, including eight DIMM slots supporting up to 128GB of DDR4-3333 (OC) RAM and four PCI Express 3.0/2.0 x16 slots for up to four-way SLI or CrossFireX setups.
Avexir updates its flashy plasma-topped RAM to DDR4
One of my favorite spots at Computex 2015 was Avexir’s colorful RAM, some outfitted with LEDs, others crowned by a tube of flickering plasma. Unfortunately, this time last year most of Avexir’s memory output was still DDR3. When I stopped by Avexir’s booth at Computex this year, I was happy to see the company has been busy updating its memory to DDR4, with fancy LEDs intact.
The Raiden memory with its blue plasma tube is now available in DDR4-2666, 2800 and 3000 speeds. The Blitz series memory, which has glowy LED tracings around its body and looks like the RAM equivalent of a Transformer, goes up to DDR4-3600 speeds. It comes in red, gold, and white. Avexir’s Core RAM has a more conservative series of LEDs mounted to the top of the stick and also comes in blue.
Source link
Myst Spiritual Successor Obduction Releases This July
Giugno 4, 2016 21:49
Cyan, the developer of Myst and Riven, has unveiled a new yet cryptic trailer for the upcoming exploration game Obduction, which releases this July.
We’ve heard little about this title since it raised over $1.3 million with its Kickstarter in November 2013, but now Cyan is revealing a bit more of what’s in store and a look the areas you’ll explore. A female voice narrating the trailer below says, “We all lost everything. Everything but our stories, and they shouldn’t be forgotten.”
Obduction begins with, you guess it, an abduction, and you are then transported to surreal landscapes. After a few delays, Obduction has since been moved to July 26. It will be available for PC, Mac, and Oculus Rift. For more on this Myst spiritual successor, and why it’s shrouded in mystery, read our interview with Cyan’s Rand Miller.
Source link
Softwares piratas rodam em metade dos dispositivos no Brasil
Giugno 4, 2016 20:31
No Brasil, a taxa de usuários de computadores brasileiros que usam software não licenciado (leia-se, pirata) caiu três pontos entre 2013 e 2015, indica pesquisa global sobre software da BSA | The Software Alliance, Seizing Opportunity Through License Compliance (As oportunidades oferecidas pela conformidade de licenciamento).
“Apesar de leve, a queda é positiva para o Brasil, que teve a menor taxa de pirataria da América Latina, mas ainda há muito a ser feito”, explica o country manager da BSA para o Brasil, Antonio Eduardo Mendes da Silva, o “Pitanga”.
A melhora pode ser atribuída às campanhas de conscientização promovidas por parcerias entre entidades como a própria BSA e a ABES (Associação Brasileira de Empresas de Software), ao crescimento da cultura de gestão de ativos de software por parte das empresas e à expansão da venda de softwares por meio da tecnologia cloud, que permite ao consumidor e às empresas um novo modelo comercial.
“O desempenho do Brasil e do México, devido ao tamanho dos mercados, influenciou um declínio de quatro pontos percentuais na média da América Latina”, explica “Pitanga”.
De acordo com o estudo, 39% dos softwares instalados em computadores ao redor do mundo em 2015 não foram licenciados adequadamente, o que representa apenas uma modesta diminuição em relação aos 43% verificados no estudo global anterior da BSA, em 2013.
Os CIOs estimam que 15% dos funcionários instalam software na rede sem que eles fiquem sabendo. No entanto, eles estão subestimando o problema, já que quase o dobro dessa quantia, 26% dos funcionários, afirmam instalar software não autorizado na rede corporativa.
“É de extrema importância para uma empresa saber quais softwares fazem parte de sua rede corporativa”, afirmou a presidente e CEO da BSA |The Software Alliance, Victoria A. Espinel. “Muitos CIOs não sabem o total de softwares instalados nas suas redes corporativas e se os mesmos são legítimos”, completa. A boa notícia, segundo o estudo, é que as empresas podem minimizar drasticamente os riscos de não conformidade estabelecendo um bom programa de SAM (Gestão de Ativos de Software).
Risco para a segurança cibernética
Os taques cibernéticos estão entre os principais riscos ligados à pirataria de software, senundo a BSA. A pesquisa, que incluiu consumidores, gerentes de TI e usuários de computadores corporativos, reforça uma forte ligação entre os ataques cibernéticos e a utilização de software não licenciado. Onde há software não licenciado em uso, a probabilidade de ocorrência de malware aumenta dramaticamente. O custo para lidar com incidentes envolvendo malware pode ser elevado. Só em 2015, por exemplo, os ataques cibernéticos custaram mais de US$ 400 bilhões às empresas de todo o mundo.
Muitos CIOs ouvidos pela pesquisadeclararam que a maior preocupação deles é a perda de dados associada a esse tipo de incidente de segurança. De fato, a pesquisa descobriu que 49% dos CIOs identificaram as ameaças à segurança geradas por malware como uma grande ameaça imposta pelo uso de software não licenciado. Eles também afirmaram que o uso de softwares legítimos e licenciados é uma medida crucial para evitar tais ameaças. E a maioria dos funcionários entrevistados (60%) compartilha dessa opinião, reconhecendo que o risco de segurança está intimamente relacionado ao uso de softwares piratas.
O relatório acrescenta que a Gestão de Ativos de Software (SAM), se bem feita, permite que as organizações otimizem o uso de softwares ao instalar aqueles que melhor se adaptem ao negócio; certifiquem-se sobre a legitimidade das ferramentas que possuem e tenham políticas e procedimentos disponíveis para reger a aquisição, implantação e desinstalação dos softwares. Tudo isso faz com que o SAM seja parte estratégica do negócio.
Fonte
Halo 5's Biggest-Ever Expansion Teased, Coming End of June
Giugno 4, 2016 17:48
Halo 5‘s Warzone Firefight expansion, the Xbox One shooter’s biggest since launch, is coming out at the end of the month. In 343’s latest weekly blog post, the developer shared a status update for how it’s coming along and teased more about what it contains.
“A wide variety of teams are hard at work to get their final work and polish completed,” 343 said. “These include the Warzone team, who are finishing up the PvE mode, the Warzone Boss Refresh we first mentioned in the last issue, and more.”
343 also released images of some of the new Warzone Firefight bosses players will encounter–they look badass. They each have Ultra-class armor, 343 said. Check them out in the images below.
Additionally, while May’s second free update, Hog Wild, did not include any new maps, that won’t be the case for Warzone Firefight. 343 said in the blog post that players can expect “new places,” while the update will also deliver “new tools of destruction.”


Additionally, 343 teased that there are “a few surprises” about the Warzone Firefight expansion that have not been announced yet. One of these could be related to Forge.
343 shared the image below, which appears to suggest the 7 Wood melee weapon might be making a comeback. 343’s Tom French said about the teaser image, “No idea what it might be for.”

The full blog post contains other details about what went on at 343 and across the Halo universe this week. Check it out here.
Warzone Firefight will be Halo 5’s seventh free expansion. The other ones were The Battle of Shadow and Light (November), Cartographer’s Gift (December), Infinity’s Armor (January), Hammer Storm (February), Ghosts of Meridian (April), Memories of Reach (May), and Hog Wild (May).
Source link
Microsoft disponibiliza SQL Server 2016 para o mercado brasileiro
Giugno 4, 2016 16:30
A Microsoft anunciou a disponibilidade geral do SQL Server 2016 na quarta-feira (01/06). Dessa forma, a ferramenta também começa a chegar para clientes da companhia no Brasil. A nova versão do banco de dados oferece melhor relação custo-desempenho para transações híbridas e processamento analítico.
“Aplicações de software agora podem entregar análises sofisticadas e modelos de aprendizagem de máquina no banco de dados, resultando em velocidade 100x maior ou mais na geração de insights, na comparação com entregas desse tipo fora do banco de dados”, garante a fabricante.
Segundo a empresa, a integração de análises avançadas em um banco de dados transacional é revolucionária. “Hoje, a maioria das aplicações de análise avançada usa uma abordagem primitiva de mover dados das bases para a camada da aplicação para obter inteligência”, cita.
Para a Microsoft, essa abordagem adotada até então incorre em alta latência por conta do movimento dos dados, não escala conforme os volumes de dados aumentam e sobrecarregam a aplicação com a tarefa de gerenciar e manter modelos analíticos.
A ideia é que o SQL Server 2016 simplifique o processo, levando a análise para mais perto de onde os dados são gerenciados, e não o contrário. “Como resultado, aplicações analíticas podem agora ser mais simples e precisam apenas solicitar os resultados ao banco de dados”, reforça, citando que modelos de aprendizagem de máquina agora podem ser feitos no banco de dados sem recompilar e reimplementar aplicações.
“Além disso, o banco de dados pode atuar como servidor central para modelos analíticos da empresa e múltiplas aplicações inteligentes podem aproveitar os mesmos modelos. Isso é uma profunda simplificação de como aplicações críticas de inteligência podem ser produzidas e gerenciadas na empresa”, anuncia.
Fonte
Learning Network Services for Professional Development
Giugno 4, 2016 13:38A “Learning Network” is a community of people who help each other to better understand and handle certain events and concepts in work or life. As a result – and sometimes also as an aim – participating in learning networks stimulates personal development, a better understanding of concepts and events, career development, and employability. “Learning Network Services” are Web services that are designed to facilitate the creation of distributed Learning Networks and to support the participants with various functions for knowledge exchange, social interaction, assessment and competence development in an effective way. The book presents state-of-the-art insights into the field of Learning Networks and Web-based services which can facilitate all kinds of processes within these networks.
R, Python, Scala ou Java. Qual é a melhor linguagem para Big Data?
Giugno 4, 2016 12:29
Você tem um projeto de Big Data, compreende o domínio do problema, sabe qual infraestrutura utilizar e talvez tenha até decidido sobre qual framework utilizará para processar todos esses dados. Porém, uma pergunta decisiva ainda paira no ar: Qual linguagem devo utilizar? (Ou, mais corretamente: A qual sofrimento devo submeter todos os meus desenvolvedores e cientistas de dados?). Essa é uma dúvida que pode ser postergada por pouco tempo.
Claro, não existe nada que impeça você de trabalhar com Big Data com, digamos, transformações XSLT (uma boa sugestão para Primeiro de Abril, só para ver como fica a cara de todo mundo). Porém, no geral, existem três linguagens preferidas para iniciativas envolvendo grandes volumes de dados em dia – R, Python e Scala – além da robusta tartaruga executiva perene chamada Java. Qual você deve escolher e por qual razão … ou quando? Aqui está uma análise sobre cada uma para ajudar a guiá-lo sua decisão.
R
R é muitas vezes chamada de “uma linguagem para estatísticos”. Caso você precise de um modelo estatístico esotérico para seus cálculos, você provavelmente o encontrará no CRAN – não se chama Rede Abrangente de Arquivos R (Compreehensive R Archive Network) sem razão, sabe. Para análise e planejamentos, não dá para superar o ggplot2. E, caso você precise explorar mais poder do que sua máquina pode oferecer, você pode utilizar as amarrações SparkR para executar o Spark no R.
Contudo, caso não seja um cientista de dados e não tenha experiência com Matlab, SAS ou OCTAVE, pode ser necessário um pouco de ajuste até ser produtivo no R. Enquanto que uma linguagem muito boa para análise de dados, ela é deficiente para propósitos mais gerais. Você construiria um modelo em R, mas consideraria traduzir o modelo para o Scala ou Python para produção, e seria pouco provável que você iria querer escrever um sistema de controle de aglomerações utilizando essa linguagem (boa sorte na parte do debug caso o faça).
Python
Caso seus cientistas de dados não gostem de R, eles provavelmente saberão Python de cor. Python tem sido muito popular no meio acadêmico por mais de uma década, especialmente em áreas como Processamento Natural de Linguagem (Natural Language Processing – NLP). Como resultado, caso você tenha um projeto que requer trabalho com NLP, você encarará um número vergonhoso de escolhas, incluindo o clássico NTLK, modelagem de assunto com GenSim, ou o extremamente rápido e preciso spaCy. De modo semelhante, Python tem um desempenho muito bom fora de sua zona de conforto quando o assunto é redes neurais, com Theano e Tensorflow, e então existe o scikit-learn para aprendizado de máquina, como também NumPy e Pandas para análise de dados.
Existe Jupyter/iPython também — o servidor notebook baseado em web que permite que você misture código, planos e, bem, quase tudo, em um formato de livro de registro que pode ser compartilhado. Esse tem sido um dos principais recursos do Python, apesar de que, hoje em dia, o conceito se provou tão útil que se espalhou por quase todas as linguagens que têm um conceito de Read-Evaluate-Print-Loop (REPL), incluindo a Scala e o R.
Python tende a ser apoiado nos frameworks de processamento de big data, mas, ao mesmo tempo, tende a não ser a melhor opção. Por exemplo, novos recursos no Spark quase sempre aparecerão no tipo nas ligações da Scala/Java, e pode levar algumas versões menores para aquelas atualizações serem disponibilizadas no PySpark (especialmente verdade para o lado do desenvolvimento Spark Streaming/MLLib).
Em comparação com o R, o Python é uma linguagem tradicional orientada a objeto, então, a maior parte dos desenvolvedores ficará bastante confortável em trabalhar com ele, onde a primeira exposição ao R ou Scala pode ser bem intimidadora. Um pequeno problema é a exigência de indentação correta em seu código. Isso divide as pessoas entre “isso é ótimo para garantir a facilidade de leitura” e aqueles de nós que acreditam que em 2016 não deveríamos precisar lutar com um interpretador a fim de executar um programa pelo fato de que uma linha possui um caractere fora do lugar (você talvez saiba de que lado estou nesse debate).
Scala
Ah, Scala — das quatro linguagens nesse artigo, Scala é a que se sente o centro das atenções enquanto todos a admiram por seu sistema de tipos. Funcionando na JVM, a Scala é o casamento mais bem-sucedido dos paradigmas funcionais e orientados a objeto, e está atualmente avançando a largos passos no mundo financeiro e em empresas que precisam operar grandes volumes de dados, muitas vezes de modo massivo (como o Twitter e a LinkedIn). Também é a linguagem por detrás do Spark e do Kafka.
Por rodar na JVM, ela imediatamente tem acesso ao ecossistema Java gratuitamente, mas também tem uma vasta variedade de bibliotecas “nativas” para manuseio de dados em escala (em particular o Algebird do Twitter e o Summingbird). Ela também inclui um REPL muito útil para desenvolvimento interativo e análise como no Python e no R.
Eu gosto muito da Scala, caso você não tenha percebido, pois ela inclui muitos recursos de programação úteis como a correspondência de padrões e é consideravelmente menos prolixa do que o Java padrão. Contudo, frequentemente existe mais de uma forma de fazer algo no Scala e a linguagem anuncia isso como um recurso. E isso é bom! Mas, dado que ela possui um sistema de tipos do tipo Turing completo e todos os tipos de operadores sinuosos (‘/:’ para foldLeft e ‘:’ para foldRight), é muito fácil abrir um arquivo Scala e pensar que se está olhando para um trecho desorganizado de Perl. Um conjunto de boas práticas e orientações a serem seguidos ao desenvolver em Scala é necessário (os da Databricks são razoáveis).
O outro lado ruim: O compilador de Scala é um pouco lento, ao ponto de que ele nos leva de volta aos dias da “compilação” clássica com XKCD. Ainda assim, ele possui REPL, suporte a big data e notebooks baseados em web no formato de Jupyter e Zeppelin, então perdoo muitos de peculiaridades.
Java
Por último, sempre tem o Java – odiado, abandonado, de propriedade de uma empresa que parece se preocupar com ele apenas quando existe dinheiro a ser obtido ao processar o Google, e totalmente fora de moda. Apenas drones na empresa utilizam o Java! Ainda assim, o Java poderia ser adequado para seu projeto de big data. Considere o Hadoop MapReduce – Java. HDFS? Escrito em Java. Até o Storm, Kafka e o Spark funcionam na JVM (no Clojure e Scala), significando que Java é um cidadão de primeira classe desses projetos. Então, existem novas tecnologias como Google Cloud Dataflow (hoje Apache Beam), que até recentemente apoiava apenas o Java.
O Java pode não ser a linguagem ninja e famosa preferida de todos. Porém, enquanto eles estão tendo dificuldade em organizar o ninho deles de call-backs na aplicação Node.js, utilizar o Java te dá acesso a um ecossistema maior de profilers, debuggers, ferramentas de monitoramento, bibliotecas para segurança empresarial e interoperabilidade, e muito mais além disso, com a maioria tendo sido testada em campo durante as duas últimas décadas. (Sinto muito, pessoal. Java completa 21 anos e estamos todos velhos).
As principais queixas contra o Java são a dura prolixidade e a falta de um REPL (presente em R, Python e Scala) para desenvolvimento iterativo. Já vi 10 linhas de balão de código Spark baseado em Scala virar uma monstruosidade de 200 linhas em Java, completo com grandes declarações de tipo que ocupam a maior parte da tela. Contudo, o novo suporte lambda em Java 8 é muito útil para retificar essa situação. O Java nunca vai ser tão compacto quanto a Scala, mas o Java 8 realmente torna menos doloroso o desenvolvimento em Java.
E o REPL? OK, você me pegou – atualmente, pelo menos. O Java 9 (que será lançado no próximo ano) incluirá o JShell para todas as suas necessidades REPL.
Que rufem os tambores, por favor
Qual linguagem você deve utilizar para seu projeto de Big Data? Temo que escolherei o caminho do covarde e fugirei pela tangente, pois ficarei firmemente com o “depende”. Caso você esteja fazendo análise de dados pesados com cálculos estatísticos obscuros, então você seria louco de não favorecer o R. Caso esteja fazendo NLP ou processamentos intensos de rede neural entre GPUs, então o Python é uma boa aposta. E para uma solução de transmissão de produção rígida com todas as ferramentas operacionais importantes, Java ou Scala são definitivamente boas escolhas.
Claro, não precisa ser uma ou outra. Por exemplo, com o Spark, você pode treinar seu modelo e pipeline de aprendizado de máquina com o R ou Python com dados em repouso, e então pode “serializar” esse pipeline para o armazenamento, onde pode ser utilizado por seu aplicativo de Fluxo de Scala Spark. Enquanto que você não deve extrapolar (caso contrário sua equipe rapidamente sofrerá de cansaço), utilizar um conjunto heterogêneo de linguagens que geram pontos fortes particulares pode gerar dividendos para um Projeto de big data.
Ian Pointer — O Consultor Sênior Ian Pointer trabalha em Mammoth Data, uma grande firma de consultoria data/NoSQL baseada em Durham, N.C. Ian é especializado na infraestrutura Hadoop e em soluções Spark e tem mais de 15 anos de experiência em desenvolvimento e operações.
Fonte