Gene Nmul_A2571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2571
Symbol
ID	3784651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2943760
End bp	2945085
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	57%
IMG OID	637812662
Product	glycerophosphoryl diester phosphodiesterase
Protein accession	YP_413252
Protein GI	82703686
COG category	[C] Energy production and conversion
COG ID	[COG0584] Glycerophosphoryl diester phosphodiesterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCCGCC AAACATCCTT CCATCCCGTA CTGATAATCT TATTTTTCTT CCTTGTCTTA 
CTGGTTATTG CGCCCGCCCT GGCCAGCGGA AGAAACGACG GCATGGAAGG AACTTCCTTC 
CATGATGCTT CTCCTGACAA TTCCAGCGGC AATGTTCAAC TCGGCCCTCG TCCTTTTTTC 
CTTGTGGAGG ACATGGAGGG CGGTGAACTC AAGAGCAAGC TCGCACGTTG CGGTGCCGGC 
CCCTTCAGGA AAACATACTT CTCCATCGGT CATCGCGGCG CGCCACTGCA GTTTCCCGAG 
CACACGGCGG AGTCCTACCG GGCGGCCGCC CGCATGGGGG CCGGCATTCT CGAGTGCGAC 
GTAACATTCA CCCGGGACAA GGAACTGGTA TGCCGCCATT CTCAGTGTGA TTTGCACACC 
ACCACGAATA TTCTGGAAAC ACCGCTTGCC GAAAAATGCA CGCGCCCTTT TACACCCGCC 
CAGTTCGATG CTTCGGGAAA CCTGATCCAG GAGGCTTCCG CCCGTTGCTG CACGAGCGAC 
ATCACTCTGG ATGAATTCAA GAGCCTGAAA GGCAAGATGG ACGCCTTCAA CCCCGGGGCG 
AGGAATGTGG CGGAATACGT GGGCGGCACA CCTGCATGGC GCACTGACTT GTATGCCGGC 
CCTACCAGTG GAACCCTGCT CAGCCACCGG GAGAGTATCG AACTCTTCAG CAAGCTGGGG 
GCAAAAATGA CACCCGAACT CAAGAGCGCG GAGGTGGCAA TGCCTTATGA CAGCGATGGC 
GACGGAGTCG GCGACTACAC GCAGGAACAT TATGCTCAAC AGATGATCGA CGAGTACAAG 
GCTGCCGATG TCAAACCTCG CGATGTCTTT CCGCAGTCCT TCGATATCCG CGATATCCGT 
TACTGGATCG CCAGGGAGCC CGAGTTCGGG AGGCAGGCGG TTTATCTCGA CGACGCCAAT 
ACGGTCGCTG ATCTTCCCAA TGCCAGTCAG TTGACCGCTT ACAAAGCCGA GGGCATCAAT 
ATTGTCGCCC CTCCCATATT CGCGCTGCTG GATGTCGATG GGGGCGGCAA TATCATCCCG 
TCCAGCTACG CCCTGCAGGC CAGGGCCGCA GGACTAGGCC TCATCACCTG GACGCTGGAG 
CGCTCCGGAA TACTAGCTGA CGGCGATAAC GGCTTTTATT ACCAGACTTT CGATTCGGCG 
ATAAGGCGCG AAGGCGATGT GATGAAAGTG CTGGATGTTT TGAACAGGGA AGTGGGCGTC 
CTCGGTATCT TCAGCGATTG GCCGGCCACC GTAAGCTATT ACGCTAATTG CATGAAGCTG 
AAATAG

Protein sequence

MIRQTSFHPV LIILFFFLVL LVIAPALASG RNDGMEGTSF HDASPDNSSG NVQLGPRPFF 
LVEDMEGGEL KSKLARCGAG PFRKTYFSIG HRGAPLQFPE HTAESYRAAA RMGAGILECD 
VTFTRDKELV CRHSQCDLHT TTNILETPLA EKCTRPFTPA QFDASGNLIQ EASARCCTSD 
ITLDEFKSLK GKMDAFNPGA RNVAEYVGGT PAWRTDLYAG PTSGTLLSHR ESIELFSKLG 
AKMTPELKSA EVAMPYDSDG DGVGDYTQEH YAQQMIDEYK AADVKPRDVF PQSFDIRDIR 
YWIAREPEFG RQAVYLDDAN TVADLPNASQ LTAYKAEGIN IVAPPIFALL DVDGGGNIIP 
SSYALQARAA GLGLITWTLE RSGILADGDN GFYYQTFDSA IRREGDVMKV LDVLNREVGV 
LGIFSDWPAT VSYYANCMKL K