Gene Noc_1933 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1933
Symbol
ID	3705470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2210340
End bp	2211719
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	51%
IMG OID	637738409
Product	peptidase M16-like
Protein accession	YP_343925
Protein GI	77165400
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0501339
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCCAC TCATACGCTT GCTAACAATC TTTTTGGCCC TGATGTTGCC ACTAGCAGTT 
ATGGCCAAAG TACATGAATT TACCCTGAAG AACGGGCTAA AGCTCCTGGT TAAGGAAGAT 
CCTCGGGCAC CGGTGATGGT TTCCCAAGTG TGGTACAAGG TGGGCTCTAG CTATGAGTAC 
AATGGGATTA CGGGTATTTC CCATATGCTA GAGCATATGA TGTTTAAGGG AACTAAAAAT 
TTGGAGCCAA ACCAATTTTC GCAGATTATT TCTGCTAACG GGGGTGAGGA AAATGCTTTT 
ACGGGCCGGG ATTACACAGC GTATTTTGAG CAGATGGCCA ATGACCAGGT AGAGGTCAGT 
TTCCGGCTGG AAGCTGATCG CATGCGCAAC CTAGTGCTCA TTCCCGAAGA ATTACGGAAG 
GAAAAGCAGG TGGTGATGGA GGAGCGGCGC ATGCGCACTG AGGATAATCC TAATGCCTTG 
ACCTACGAGC GTTTCAACGC TACCGCTTTT CTCAGCGGCC CCTATCATCA TCCCGTGATT 
GGTTGGATGA GCGATATTCA ACACTATGAA CTCAAGGATT TGCAAGCCTG GTATCAGAAG 
TGGTATGCCC CTAACAATGC CACTGTGGTG GTCGTGGGAG ATGTAGACCC TGAGGCCGTC 
CATGCTTTGG CTGAAAAATA TTTTGGCTCC TTAAAACCAG AGAAAATCAC TCCCCCCAAA 
CCCCAGGAGG AGATTTCCCA GACTGGCCGG CGGGAGATTT TTGTGCGGGC ACCGGCTGAG 
CTGCCTTATT TGCTGTTAGG GTGGAAGGTG CCGGTTATAA AGAACGCGGA AGAAGACTGG 
GAAGCCTATG CCCTGGAGGT GTTAGGCGGG ATTTTAGATG GAGGGCGTAG TTCTCGCTTT 
TCCAGGGAAC TTATCCGGGG CAGCCAAGTG GCTACCAGCG TAGGGGCCAG CTACCATTTG 
TATGGGCGCA TCAAAGACCA ATTTGTGATT GCTGGAGTAC CGGCCCAGGG ACGGACTATT 
GCCGAGTTGG AGGAGGCTAT TTGGGCACAG ATTCAGCGCC TGCAAAAAGA ACTCGTGAGC 
AAGGAGGAAC TGGAGCGAAT CAAAAACCAG GTAGTTGCCC ATCAGGTTTT TGAACAGGAC 
TCCATGTTTT TTCAGGCCAT GCAGCTAGGG TTGCTGGAAA CGGTTGGGCT AGACTGGCGG 
CTAGCGGATG CCTATGTGGA TCAGGTGCGC GCCATTACCC CTGAACAAGT CCAGGCGGTT 
GCCCAGAAAT ATTTGTTGGA GGCCAGGTTA ACCCGGGCGG AATTGGTGCC TTTACCTATT 
GAGCCAGGAG AAAAAGCGCC TTCGACTCAG CCCGTGGAAG GAGGTCGCCA TGTTTCGTAG

Protein sequence

MTPLIRLLTI FLALMLPLAV MAKVHEFTLK NGLKLLVKED PRAPVMVSQV WYKVGSSYEY 
NGITGISHML EHMMFKGTKN LEPNQFSQII SANGGEENAF TGRDYTAYFE QMANDQVEVS 
FRLEADRMRN LVLIPEELRK EKQVVMEERR MRTEDNPNAL TYERFNATAF LSGPYHHPVI 
GWMSDIQHYE LKDLQAWYQK WYAPNNATVV VVGDVDPEAV HALAEKYFGS LKPEKITPPK 
PQEEISQTGR REIFVRAPAE LPYLLLGWKV PVIKNAEEDW EAYALEVLGG ILDGGRSSRF 
SRELIRGSQV ATSVGASYHL YGRIKDQFVI AGVPAQGRTI AELEEAIWAQ IQRLQKELVS 
KEELERIKNQ VVAHQVFEQD SMFFQAMQLG LLETVGLDWR LADAYVDQVR AITPEQVQAV 
AQKYLLEARL TRAELVPLPI EPGEKAPSTQ PVEGGRHVS