Gene Noc_2887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_2887
Symbol
ID	3707441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	3265572
End bp	3266768
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	49%
IMG OID	637739363
Product	hypothetical protein
Protein accession	YP_344863
Protein GI	77166338
COG category	[R] General function prediction only
COG ID	[COG1913] Predicted Zn-dependent proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.286834
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTCTA ACTTACAATC TTACCCTCCA AACACAATAG AATTAGGATG GCTGATTATT 
AATGAGCTGG AGTCCGTAGA AGAAATTTCT ATCTCTCAAG GACGGGCTCA AATGCTCCAA 
TACCTGCAAC AGCACTTTCC TCAATTTGAA TGGCGGATGC CCGTCATTAA ACGGACCGAA 
CAGCCTCACG GCACCCTGGA AGCCCCCACC GATTTACTAC AAAAAGGCGA GCATGAGCGG 
GAAATCCGGC GCTGGGATTA TGCGTTTGTA GTCACCCGCG CCGATTTAAA AAGCTATTAT 
AAACCTTACG CTTTGGCAAT ACCTTCCCGG GCCATAAATG TGGCGGTGCT CTCCACTGCT 
CGGCTTGCCT TTCACTTGGA TGACGATAAA AATAACACGG TCATGGCGCA GCAGATCTTC 
GCCTTGGGAA TGCACCTATT AGGTGATTTA AATGATTTGC CCCATAGAGA TGATCCGAAA 
GGATTTATGT ATCCGCCCCG AATCATCCGT GACCTAGACG GAATGACAAG CTATTCACAG 
AAAGAGCAAG AACAACTTGC TGAAGCTTTT GCAGAGGTGG GAGACATTCG TTTAGAAGAA 
CAATTCCAAA CCGGCAAAAC GCGGCCCTGG CTTTTCTATC TTAAAGTCCT CGGGAGGAGT 
CGCGGCGATA TTGCCAGCGC TGTCATACAA GCTAAACCTT GGGAGTTTCC TTTTCGATTA 
AGCCGCTTAA CGGCAGCAGC GATCTCCACT TTGCTTGTCC TGATCATCAC GGCTGAAGTC 
TGGGAACTAG GCATGAGCCA ACCGCCGCTG CTTGTCACTG GACTCTCACT GCTGGCATTG 
ACCGGCACCA GCCTGTTTAT TCTGAAACGG CAGCAGTTAT TGCTCCATCG GGGCAAGCGC 
CCATTAACCG AACAGACGGT TATTACCAAC CTTGCCATTA CTACGGTGGT GGTCCTGGGA 
ATGACGACCA CTTACCTGAT GTTATTTTTG CTAGTGCTAC TCTTAGGGAA GGTCTTCTAT 
AATCCCGTCT TGCTCCAAGG ATGGGCTGCC TCCCTAGAAA GCCATATTTA CCTCCGGCAC 
TATTTGGTGC TATCCGGATT TATCGCCTCC TTAGGAATAA TGATAGGCTC GCTAGGCGCT 
TCCTTTGAAG GCCAGCGTTA TTTTCGTCAT GTCACCTATG TAGACGAGGA AATTTAA

Protein sequence

MASNLQSYPP NTIELGWLII NELESVEEIS ISQGRAQMLQ YLQQHFPQFE WRMPVIKRTE 
QPHGTLEAPT DLLQKGEHER EIRRWDYAFV VTRADLKSYY KPYALAIPSR AINVAVLSTA 
RLAFHLDDDK NNTVMAQQIF ALGMHLLGDL NDLPHRDDPK GFMYPPRIIR DLDGMTSYSQ 
KEQEQLAEAF AEVGDIRLEE QFQTGKTRPW LFYLKVLGRS RGDIASAVIQ AKPWEFPFRL 
SRLTAAAIST LLVLIITAEV WELGMSQPPL LVTGLSLLAL TGTSLFILKR QQLLLHRGKR 
PLTEQTVITN LAITTVVVLG MTTTYLMLFL LVLLLGKVFY NPVLLQGWAA SLESHIYLRH 
YLVLSGFIAS LGIMIGSLGA SFEGQRYFRH VTYVDEEI