最近接触到一个外包,正在跟甲方沟通,双方还没签合同。
甲方是做出版行业的,在国内外、尤其是国外有一些行业资源。
想做一个文献检索查询网站。可以比喻作,国外版的知网、万方,垂直行业的 Google Scholar。
他们自己有些数据库,然后合作方也提供一些数据。内容无非就是:题目、作者、刊名、摘要等。原文( pdf )等文件不会存储在自己的服务器,都存在第三方的合作方网站上。本地服务器只留一个链接过去就行。
目前他们自己有 300-400 万条数据。平均每年要增加约几十万(不到 100 万)条数据。合作方(第三方)有 api 的话,直接用就行;没有 api 就只能合法爬过来。
因为行业不算大众化,所以前期预计每天约 5k-10k 访客。甲方并不靠这个网站盈利,只希望在行业内布局。
参考:Google Scholar 和百度学术。
考虑到未来扩展的可能性,请问这个网站的前后端应该如何架构才能更高效运转?
有没有愿意合作这个项目的?我做总包签下这个项目,然后大家一起来做、一起分钱。
甲方是做出版行业的,在国内外、尤其是国外有一些行业资源。
想做一个文献检索查询网站。可以比喻作,国外版的知网、万方,垂直行业的 Google Scholar。
他们自己有些数据库,然后合作方也提供一些数据。内容无非就是:题目、作者、刊名、摘要等。原文( pdf )等文件不会存储在自己的服务器,都存在第三方的合作方网站上。本地服务器只留一个链接过去就行。
目前他们自己有 300-400 万条数据。平均每年要增加约几十万(不到 100 万)条数据。合作方(第三方)有 api 的话,直接用就行;没有 api 就只能合法爬过来。
因为行业不算大众化,所以前期预计每天约 5k-10k 访客。甲方并不靠这个网站盈利,只希望在行业内布局。
参考:Google Scholar 和百度学术。
考虑到未来扩展的可能性,请问这个网站的前后端应该如何架构才能更高效运转?
有没有愿意合作这个项目的?我做总包签下这个项目,然后大家一起来做、一起分钱。