Gene Nmul_A0853 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0853
Symbol
ID	3784541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	969465
End bp	970760
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	60%
IMG OID	637810935
Product	peptidase M20D, amidohydrolase
Protein accession	YP_411548
Protein GI	82701982
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACGC AACCAGCGAG CTCTCTTGGA AAGGTACTAG CGGGGCTTCA GAACCTGCTG 
CCGGATCTGG AGGCGTTATA TACCGACGTG CATGCCCATC CGGAGCTGTC GATGCAGGAA 
TCGCGTACCG CAAGCCTAGT CGCGGAACGA CTTCGCGCGG CTGGGTATGA CGTGACGACG 
AGGGTTGGGA AGACGGGTGT CGTGGGATTG CTGCGCAACG GCGACGGGCC GACCGTCATG 
CTGCGTGCCG ACATGGATGC ACTACCCATC GAGGAAATGA CCGGGCTTCC CTATGCCAGC 
AAGGTCAAGG CCACGAATCA CGAGGGTAAA ACGGTCCCGG TCATGCACGC TTGCGGCCAT 
GACATGCACG TTGCCTGGCT CGTCGGTGCG ACCACGCTGC TCGCGCAGGC GCGTAATACA 
TGGGGCGGCA CGTTGATGGC AGTCTTCCAG CCGGCTGAAG AGACTGCGGA AGGCGCCCAA 
GCCATGATCG ACGATGGACT GTTCAACCGT TTTCCAATGC CGGATGTCGT GCTTGGCCAA 
CACGTCATGG TGGGGCCGGC GGGCAATATT GGCGGCCGTG CCGGATCCAT CACTTCCGCT 
GCCGACAGCC TGCAGATCCG CCTGTTTGGG CGTGGGGCGC ACGGATCAAT GCCGCAGGCA 
AGCATCGATC CGGTTGTCAT GGCTGCCGCG ACTGTAATGC GCCTGCAGAC CATTGTCTCG 
CGTGAACTTG CTGCTGCCGA GGCCGCTGTC GTTACCATTG GCGCGTTGCA GGCGGGCACC 
AAGGAAAATG TGATACCCGA CGAGGCGGTC ATCAAGCTGA ATGTACGCAC CTTTGATGCG 
GATGTGCGCA AGCGTGTACT TGCCGCCATC GAGCGTATCG CCAATGCAGA GGCTGCAGCT 
TCGGGAGCCC CCCGGCCGCC CGAGATTACG ACGCTGGAAC ACTACCCTCT AGGAGTCAAC 
GATGCCGATG CAAGCGGCCG CGTCGCCGAT GCTTTCCGTC AATATTTCTC AGCCGACCGC 
GTGCGGCAAG TCGATGCGGC GTCGGCGAGC GAGGATTTCG GGTTGTTCGG AACCGAGTGG 
GGTGTCCCTT CCGTGTTCTG GTTCGTCGGA GGTACCGATC CCGACCTTTA CGCGAAAGCC 
AAGGCCGCAG GTGAAATCAA CAAGATTCCA ACGAACCACA GTCCATACTT TGCACCAGTA 
ATGCATCCCA CTCTGGAAAC TGGCGTGGAA ACGATGGTCA TTGGCGCCCT GGCTTGGCTT 
CAGCATGAGT CGCAGCACCA GGAGCTGAGA CCATAA

Protein sequence

MNTQPASSLG KVLAGLQNLL PDLEALYTDV HAHPELSMQE SRTASLVAER LRAAGYDVTT 
RVGKTGVVGL LRNGDGPTVM LRADMDALPI EEMTGLPYAS KVKATNHEGK TVPVMHACGH 
DMHVAWLVGA TTLLAQARNT WGGTLMAVFQ PAEETAEGAQ AMIDDGLFNR FPMPDVVLGQ 
HVMVGPAGNI GGRAGSITSA ADSLQIRLFG RGAHGSMPQA SIDPVVMAAA TVMRLQTIVS 
RELAAAEAAV VTIGALQAGT KENVIPDEAV IKLNVRTFDA DVRKRVLAAI ERIANAEAAA 
SGAPRPPEIT TLEHYPLGVN DADASGRVAD AFRQYFSADR VRQVDAASAS EDFGLFGTEW 
GVPSVFWFVG GTDPDLYAKA KAAGEINKIP TNHSPYFAPV MHPTLETGVE TMVIGALAWL 
QHESQHQELR P