Gene Noc_1865 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1865
Symbol
ID	3705129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2120745
End bp	2123987
Gene Length	3243 bp
Protein Length	1080 aa
Translation table	11
GC content	52%
IMG OID	637738344
Product	hypothetical protein
Protein accession	YP_343861
Protein GI	77165336
COG category
COG ID
TIGRFAM ID	[TIGR02243] conserved hypothetical protein, phage tail-like region

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTTTC GGCCGGGCAT ATTGCTCGAT GATAGAGACG CGGCGCAGAT CTTAAAGGCA 
TTGTTAGCGC GACGGCTCGG TTATGTGCCA GAGTGGGAGC CGCAGGGTCC AGGGTTGGCG 
TTGGCCGAGG TTTTTGCCCG TTACTTGCAG ACAATCATTC AGCGCCTGAA CCAGGCGCCG 
GATAAAAATA AACTAGCGTT TTTAGATTTA CTGGGTTTGC AGTTAATCCC GGCGCGGGCT 
GCCCGGACGC CGATCGTCTT TCGTTTGGCG GAGAATGCTC CTGATGGCAG ATTACCGGCC 
GGCACGCGTG TAGCTGCTCC GCCCCCTCCA GAGCAGACCG ATCAGATTAT CTTCGAAACC 
GAACGATCGA TCGGATTGAT GACGGCAAGA CTTAAAGAAG TCGTAAGCCT CTGGCCTGGT 
CGGGATCAAT ATATCGACCA CAGTGCGGCA TTTATCGCAG GCCGGCCCTT ACAGCCCTTT 
AAAAAACGCC AGTTAGAAAA TACGCCCCAT ATCCTCTACT TAGCCCATGA TACGCTGCTA 
GCCCTAGCAG GAAAAAGTTT ATTGAATGTC ACGTTTGAGC TAACTAACAC GAGCAGTGAA 
CGATTGGACA TTGTATGGGA GTACTGGGAT GGCGAGGTCT GGCGTGAGTT TTTAGCAATG 
CGGCCGGCCT GTGATGAAGA AGAAGCACAC AAGTTAGACA GTACTGACGG TCTACAGTAC 
AGCGGCCGCT TCCGCCTGCA AGCAGACTGC GCCGAGACAA AAAAAACCAT GGTGAATGGT 
GTCGACGCCT TCTGGATTCG CGGCCAGTTG GCAGAGCCCT TGCCCTTGGA TCCGGAGCAG 
ATATTACCTG AGGTGGAGAG CATTCAGATT GGGGCGGAGA TCGCTTCTAC TTCCCCTATT 
GAGGTAACTA TCGAAGAGGC TATCGATATT GAGAAAGCTA TCAAAAAGGT TATCGAGTCC 
AAAAAGGTTA TCGAGTCGCC TGCAACGGGT GGTTTAATCC TAGACAAGGC TTTTTCCGAT 
GCGACAGACA TCGATGTGAC TAAACCTTTC TTTCCTCTTG GCTTACAACC TCAGCCCGGT 
TCAGTGTTTT ATTTTACCAA TGCCGAAGTC TTCAGTAAGC CAGGGGCAAG AGTGCGACTC 
TATATCGGAA AAACAGTGAC GCCATCCGAT CAGCTCGTGA CGAATTCGAC GAGTGACGGG 
CTCAGAATGA CCACTGATAC AAATAATTCG CAATTGCCCC ACGAAGTCAG CTGGGAATAT 
TGGAACGGAC GAAAGTGGGA AGTTTTAATA ACCTATAGCA ATGATCCCAA TGGCTCCAGT 
GCTTTATCGA AGTCTCCACA AGATTTTAGC GATAGCGGCT TTATTGATTT AATTATCCCA 
ACGGATATGG CCCCAACCAC AATCAATGAG GAGGAAGGGC TGTGGATGCG GGTACGTTTA 
TTGAGCGGGG GTTATGGCTT CAAAAGTTCT ATTTCTACTG GCGACTCTTT AACTGAATTC 
CCCTTTATTA TCACTCAACC CCCAGCACTC TCTAACTTTC TCTTGAGCTA CACTTGGCAG 
TATGGGCCGT TTCACCCAGA GTACGTTGTT ACTTATAACA ATTTTCAGTA CGAAGACCAT 
ACCGAAGAAG CCAAATGGCC TGGGCAGACC TTTCAGCTAT TTAAGCCGGT TACCGATATT 
ACTCCATCAT TTTACCTAGG CTTTGATAAA AAGCTGCCAG TCGATCGCCT GGGTATCCTC 
TTCGATATTC TGGAACAGCC AACTGAAGCC CAAGGTCCAG CTTTGCTTTG GGAATACTGG 
GATGGTATTG CTTGGCAAGC CCTTTCCGCC GAGGATGGGA CGCAAAATCT CCGTGTCCCT 
GGATTGGTGT CTTTCATTGG CCCACAGGAC AGTCAGGCGC TGGCCCGTTT TGCCGCGCCA 
TTGCACTGGC TGCGCGCACG GCTTAAAGAG GATGGTCCGC CCGGAGAACC CGTTATCCAG 
AGTGTTTTTC CAAACGCGGT TTGGGCAACT CAACAACAGA CGATTGTTGA TGAGCCAATG 
GGAGCCAGTA CGGGTCAACT CCACCAGATT TTCTCCTTTC GCCAGATCCC TGTTCTCGCA 
GGGCAACAGA TTGAAGTACG AGAGCTTGCT GGGGCACGGG CGAATGTGGA GTGGCGCCTG 
ATAGCGAGGG AAATCTTGGG TAGAGAGGAG AGGGCGCTCA GTGAAGTTGA ATCGATGCTG 
GCTCTTGAAG GTGCTCAAAC TGACATCGAA AAAAACAATC TTCGTCTCAG GCGGGATCGT 
CGCAAGCAGG TGACCGAAGT TTGGGTGCGT TGGCAGGAGC AGCAGCATCT TCTCTTTTCG 
AAGCCGAGTG ACCGCCACTA TGTGGTTGAC CGGGGGCAAG GGCAACTTTT ATTCGGCGAT 
GGGGTACGCG GCAAGATTCC GCCGTCCGGT GCGGCGATTT TAGCGCGACA ATATCGCTCC 
GGGGGCGGTC GTAGAGGTAA TTTACCGGCC CAGACGATAA AACAAGTAGT GGGTCCGATT 
GGCGGCGTGG AGGAAGCATT TAATCCGCTC CCTAGCGAAG GCGGTGCTGA TCGTGAGAGT 
CTGGAGAATT TTGCCTTTCG TGGACCACAA ACTCTCCGTC ATCGCGGACG CTCCATAGGC 
TTAAAAGATT ATGAGACATT AGCCTATGAA GCCTCGGCTG CGGTGGCTTT TGCCCGCGCG 
ATCCCAACCC ATAATCCAAG CGGTCGATCC ATTCCCGGTT GGGTGACTTT GCTCATTATC 
CCCCAGAGTC AAGAGCCACG CCCCTGGCCC TCATTTGGGC TGCGAGAGCG GGTTCGAAAA 
TATATCGAGG CGCGTGCTCC AGCCGATCTG GCCGCTGCCC ATCAGATCTA TGTTACCGGA 
CCCGATTATC TACCTATAGG GGTGACGGCC ACGATCGTAC CCATTGATCC TGCTGAAGCA 
GGGGCCATAG AGCAACGTGC GCAAGAGGCG TTAGAGGATT TTCTCCATCC ATTGCGCGGG 
GGACCTGAAA GACGCGGCTG GGCACTGGGG CGAGATGTCT TCGTTTCCGA TGTGGCCGCG 
GTAATGGAGC GGATACCGGG AGTTGATTAC GTGGAAGAAT TGGGATTGTT GCTTAGGGGG 
GGGTTGCAGG GCGAGCGAAT TAGGGTGGCT GAAGATAGGA TTGTGGTGGC CGGAGAGATC 
CAGCTCAAGC TGAAGGCAGG GGAGAGACAG CGCTATGCCA GTACCATTGC CAAACCTAGA 
TGA

Protein sequence

MIFRPGILLD DRDAAQILKA LLARRLGYVP EWEPQGPGLA LAEVFARYLQ TIIQRLNQAP 
DKNKLAFLDL LGLQLIPARA ARTPIVFRLA ENAPDGRLPA GTRVAAPPPP EQTDQIIFET 
ERSIGLMTAR LKEVVSLWPG RDQYIDHSAA FIAGRPLQPF KKRQLENTPH ILYLAHDTLL 
ALAGKSLLNV TFELTNTSSE RLDIVWEYWD GEVWREFLAM RPACDEEEAH KLDSTDGLQY 
SGRFRLQADC AETKKTMVNG VDAFWIRGQL AEPLPLDPEQ ILPEVESIQI GAEIASTSPI 
EVTIEEAIDI EKAIKKVIES KKVIESPATG GLILDKAFSD ATDIDVTKPF FPLGLQPQPG 
SVFYFTNAEV FSKPGARVRL YIGKTVTPSD QLVTNSTSDG LRMTTDTNNS QLPHEVSWEY 
WNGRKWEVLI TYSNDPNGSS ALSKSPQDFS DSGFIDLIIP TDMAPTTINE EEGLWMRVRL 
LSGGYGFKSS ISTGDSLTEF PFIITQPPAL SNFLLSYTWQ YGPFHPEYVV TYNNFQYEDH 
TEEAKWPGQT FQLFKPVTDI TPSFYLGFDK KLPVDRLGIL FDILEQPTEA QGPALLWEYW 
DGIAWQALSA EDGTQNLRVP GLVSFIGPQD SQALARFAAP LHWLRARLKE DGPPGEPVIQ 
SVFPNAVWAT QQQTIVDEPM GASTGQLHQI FSFRQIPVLA GQQIEVRELA GARANVEWRL 
IAREILGREE RALSEVESML ALEGAQTDIE KNNLRLRRDR RKQVTEVWVR WQEQQHLLFS 
KPSDRHYVVD RGQGQLLFGD GVRGKIPPSG AAILARQYRS GGGRRGNLPA QTIKQVVGPI 
GGVEEAFNPL PSEGGADRES LENFAFRGPQ TLRHRGRSIG LKDYETLAYE ASAAVAFARA 
IPTHNPSGRS IPGWVTLLII PQSQEPRPWP SFGLRERVRK YIEARAPADL AAAHQIYVTG 
PDYLPIGVTA TIVPIDPAEA GAIEQRAQEA LEDFLHPLRG GPERRGWALG RDVFVSDVAA 
VMERIPGVDY VEELGLLLRG GLQGERIRVA EDRIVVAGEI QLKLKAGERQ RYASTIAKPR