Gene Nmul_A0128 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0128
Symbol
ID	3785776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	133190
End bp	134512
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	57%
IMG OID	637810198
Product	peptidase M24
Protein accession	YP_410829
Protein GI	82701263
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCCCG TTAAATCCTT CGCCGATCGT CGCCACTCCC TGGCATGGCA AATGCAGGAA 
GGCGTTGCCA TCATTCCCAC TGCCCCTGAG CACCTGCGGA ACCGGGATGC GCATTATCCT 
TACCGTTTCG ACAGCTATTT CTATTATCTG ACGGGCTTTA CCGAGCCGGA GGCAGTGCTG 
GTGATCGTAG CCGGGCCCGT GGATGGGGTA TCGAAACACA TCCTGTTTTG CCGGGAGAAA 
AATGCCGAGC GAGAGATATG GGATGGGTAC CGTTATGGCC CCGAAGCGGC CCGGGAAGCG 
TTCGGGTTCG ACGAGGCCTA TTCCATCTCT GCACTGGATG AGCAGTTGCC CAAGCTGATT 
GCGGGACAAC CGGCAATCTA TTACTCGCTG GGTCACGACG CGGCCTGGGA CAGGCGGGTA 
GTGGGGTGGA TCAATGAAGT GCGGCAACAG GTGCGCAGCG GCCTTACTCC CCCCGAGGAC 
ATTCGCGATA TTCGCCGGCT GCTGGACGAG ATGCGTTTGT TCAAAAGCCC GGAAGAGCTG 
CAGGTTATGC GCCAGGCGGC ACGGATTTCG GCGGGTGCGC ATCAGCACGT CATGCGGAAA 
ACTCGCGTTG GCATGAGGGA GTATGAAGTG GAGGCGGAAC TGCTGCGCGA ATTCCGCCGC 
CACGGAGCTC AAGCGCCGGC TTACACCCTG ATTGTTGCCG GGGGAGCGAA CGCTTGCGTG 
CTTCATTATG TCGAAAACAA GGACAGGCTG AATGAAGGCG AATTGTTGCT GATCGACGCA 
GGCTGCGAAC TGGACGGCTA TGCATCTGAT ATCACGCGTA CCTTTCCGGT CAACGGAAAA 
TTCAGTGCGG CACAAAAGGA TTTGTACGAA CTGGTGTTAT ATGCCCAGGC GGCGGCGATA 
GCCGAGGTAA GGCCCGGTAA TTCCTGGGAC GCTCCGCACA ATGCAGCCAT TGCCGTACTC 
TCGCAGGGCT TCATTGAATA CGGTCTGTGC CGCGGCAGCC TGGAGGAGGT AGTGGAAACG 
GAAGGCTACA AGCGTTTCTA TATGCACCGC ACCGGTCATT GGCTGGGGTT GGACGTGCAT 
GACGCCGGGG AATACAAGCA GAATGGAAGA TGGCGCGCTT TACTCCCGGG AATGACCCTG 
ACAGTGGAAC CGGGGTGTTA CATCCGCCCT GCGGATGATG TACCCGCCCA TTTTCATAAT 
ATCGGCATCC GTATCGAAGA CGATGTTACG GTAACGGAGG AGGGGTGTGA AGTATTGACG 
TCAGCTGCTC CAAAGATGGT GGATGAGATT GAAGAACTGA TGCGACGGCG GAAATCGAAA 
TAA

Protein sequence

MTPVKSFADR RHSLAWQMQE GVAIIPTAPE HLRNRDAHYP YRFDSYFYYL TGFTEPEAVL 
VIVAGPVDGV SKHILFCREK NAEREIWDGY RYGPEAAREA FGFDEAYSIS ALDEQLPKLI 
AGQPAIYYSL GHDAAWDRRV VGWINEVRQQ VRSGLTPPED IRDIRRLLDE MRLFKSPEEL 
QVMRQAARIS AGAHQHVMRK TRVGMREYEV EAELLREFRR HGAQAPAYTL IVAGGANACV 
LHYVENKDRL NEGELLLIDA GCELDGYASD ITRTFPVNGK FSAAQKDLYE LVLYAQAAAI 
AEVRPGNSWD APHNAAIAVL SQGFIEYGLC RGSLEEVVET EGYKRFYMHR TGHWLGLDVH 
DAGEYKQNGR WRALLPGMTL TVEPGCYIRP ADDVPAHFHN IGIRIEDDVT VTEEGCEVLT 
SAAPKMVDEI EELMRRRKSK