Gene Nmul_A0434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0434
Symbol
ID	3785902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	481487
End bp	483010
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	56%
IMG OID	637810510
Product	Ppx/GppA phosphatase
Protein accession	YP_411134
Protein GI	82701568
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGAAT ACTCCACACT TGCGGCGGTA GATCTCGGTT CCAACAGCTT TCGTTTGCAA 
GTCGCGCGAG TGGAAGGCAG ACAGCTTTAT CCGCTGGACA ATCTGCGTGA AATGGTTCGT 
CTTGCCGCTG GTCTTACTCG CGACAAGCGC CTGGATGAAG ATTCCCAGGC ACGCGCCCTG 
GCCTGTCTCA CGCGTTTCAG TGAACGCCTG CGCGGTTTCC CTCCTCATGC TGTACGTGCG 
GTTGCGACCA ACACTCTCAG GGTGGCGAAA AATGCGGCTG TATTTCTCAA AAAAGCCGAG 
GCAGCGATGG GTTTTCCCAT TGAAGTCATC TCGGGCCACG AAGAGGCGCG CCTCATCTAT 
CTGGGCGTTG CGCACGGCCT TCCTGCTTCT CCTGACGCTC GCCTGGTAAT GGACATCGGG 
GGCGGCTCTA CTGAATTTAT CATTGGCCGC AGGCTGAAGC CGGTCAAGCT GGAAAGCCTC 
TATATGGGTT GCGTCAGCTA TAGCCTGCGC TTTTTTCCAG GCGGCAGGAT CAGCAGGGAG 
GCAATGAACC GTGCCGAACT ATCGGCCCGC AGCGAGATTC AGGCGATCGC AAAGGAATTT 
TCCAGTGAAC ACTGGCAGCT CGCATATGGA TCCTCCGGTA CGGCACGCGC GTTAGGCGAT 
ATCATCCAGT TGAACCAGCT CGGCAGTGGA AGCGGCAACG GAGAGATTAC GCGGGAAGGG 
CTGGAAAATT TTCGTAATCA TCTGCTCAAG GTGGACGATA TCAAAAAACT CGACCTCGCG 
GGTATCAAGA CCGATCGGGC GCCTGTCATA GCCGGCGGTT TCGCCATCAT GTCCGCCGCG 
TTCGCGGAGC TGGGAATTTC CCGGATGGCG CAAGGCATGG GTGCCTTACG TCAGGGCGTG 
CTGTACGATC TGCTGGGGCG CTTCCATAAG CATGATATGC GCGAAGTAAC GGTCAGGCAG 
TTCATGCGCC GGTACCATGT GGATGGCGCG CAGGCGGGGC GGGTGGAATC GACTGCACTT 
TTGCTCGGAG AACAGTTGCT GGCGGCCTTT CCCTGTGAGG GAGAAGAACA TCTGCAAGTT 
CTCTCATGGG CTGCCCGGCT GCATGAAGTA GGTATTTCGG TCGCCCACTC CGGTTACCAC 
AAGCATTCTG CATATATCCT GGGTAATGCC GATATGCCGG GTTTTTCCCA AAGGGAGCAG 
GAGCGCTTAA GCATGCTTGT GCTCGCCCAC CGGGGCGATA TCGGCAAAGC GCGTGGAAAC 
ATGATAGAGC GGGCTGATTT CGCCCTGCTG TTTGCGCTTC GCCTCGCGGC ATTGTTTCAT 
CGCAGCCGCT GTGAGACGGC ACTTCCGAGG CTCGAGGTCA GCCTTCGAGG CAAGGAATTC 
AGTTTATATC TTGAAAGAAA GTGGCTGGAA GGCAATCCCT TGACATATAA CGCGTTGCTT 
GGCGAAATTG AACAGTGGGA TGCCCTTGGT TTTCGTTTTG GCATGGCCGG AGCCGACGGA 
AGCAAGTTGT CCGCATCTGT ATAA

Protein sequence

MPEYSTLAAV DLGSNSFRLQ VARVEGRQLY PLDNLREMVR LAAGLTRDKR LDEDSQARAL 
ACLTRFSERL RGFPPHAVRA VATNTLRVAK NAAVFLKKAE AAMGFPIEVI SGHEEARLIY 
LGVAHGLPAS PDARLVMDIG GGSTEFIIGR RLKPVKLESL YMGCVSYSLR FFPGGRISRE 
AMNRAELSAR SEIQAIAKEF SSEHWQLAYG SSGTARALGD IIQLNQLGSG SGNGEITREG 
LENFRNHLLK VDDIKKLDLA GIKTDRAPVI AGGFAIMSAA FAELGISRMA QGMGALRQGV 
LYDLLGRFHK HDMREVTVRQ FMRRYHVDGA QAGRVESTAL LLGEQLLAAF PCEGEEHLQV 
LSWAARLHEV GISVAHSGYH KHSAYILGNA DMPGFSQREQ ERLSMLVLAH RGDIGKARGN 
MIERADFALL FALRLAALFH RSRCETALPR LEVSLRGKEF SLYLERKWLE GNPLTYNALL 
GEIEQWDALG FRFGMAGADG SKLSASV