Gene Nmul_A0469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0469
Symbol	pgi
ID	3786016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	523946
End bp	525586
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	55%
IMG OID	637810545
Product	glucose-6-phosphate isomerase
Protein accession	YP_411169
Protein GI	82701603
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0166] Glucose-6-phosphate isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGAAAC CCATGATCAC GCCCCTGACG CAAAGGCCTG CCTGGAAGGC ACTGGAAGCG 
CACTACCAGA CGATCAAAGG CATGCATTTG CGTCAGCTCT TCGCTGACGA TCCGAAGCGG 
GGTGAGCGAT TTACGGCCGA GGCCGTCGGC CTGTACCTGG ATTATTCGAA AAATCGCATC 
ACTGATGAAA CGCTTCATCT ACTGGTGCAG CTTGCCGAAG AATGCGGCCT GCGCGAGCGC 
ATTGAAGCCA TGTTCAGGGG TGACGCCATC AATGTGACAG AACAGCGTGC TGTACTCCAC 
ATCGCCTTGC GCGCGCCTCG TAATGAAAAA ATCCTCGTCG ACGGAAATGA CGTTGTGCCC 
GGGGTGCATG CCGTGCTCGA CCGTATGGCG GATTTCTCCG ACAAGATACG CAGCGGGGAC 
TGGCAGGGGC ATACTGGCAA GCGAATTCGC AATATCATCA ATATCGGTAT CGGCGGCTCC 
GATCTGGGCC CGGTGATGGC GTATGAAGCG CTGCGCCACT ACAGTCTGCA CAATCTCAGC 
TTTCGTTTCA TCTCCAATGT TGATGGCACG GATTTCGTGG AGGCTACACG AGGTCTTGAT 
CCCGAAGAAA CCCTGTTCAT TATCTGCTCC AAGACATTCA CGACAACGGA AACGCTGGCC 
AATGCCCACA CCGCCCGGCG GTGGATGCTG CGACAGATAA AGGACCTGGA GGGGGTGCGC 
AAGCACTTCG TCGCTGTTTC CACCAATGCG GAGGAAGTAG CCAGATTCGG CATCGATACC 
GCCAACATGT TCGAATTCTG GGACTGGGTA GGTGGACGCT ATTCCATGGA CTCCGCGATC 
GGACTCTCAA CCATGATTGC CGTCGGCCCA GAGAATTTCC GTGAGATGCT TGCCGGCTTC 
CATGCAATGG ACCAGCACTT CTATTCCGCT CCGTTCGACA GGAATCTTCC TGTCCTGATG 
GGATTGCTGT CGCTCTGGTA TAACAATTTC TTTGGCGCGC AGACACTCGC CGTACTGCCC 
TACGAGCAAT ATTTGAAGCG CTTTCCGGCT TACCTCCAGC AACTGACAAT GGAGAGCAAT 
GGAAAGCACA TTACACTGAA TGGCTCCCAG GTTGACTACC AGACCTCACC TATCGTGTGG 
GGAGAACCCG GCACCAACGG ACAACATTCG TTTTACCAGC TCATCCATCA GGGAACCCGA 
TTGATTCCCT GTGATTTTAT CGGCTTCTGC CAAACCCTGA ACCCCTTGGG CGATCACCAT 
GACCTCCTCA TGGCGAATCT GTTTGCCCAG ACCGAGGCGC TTGCTTTCGG AAAAACGGAA 
GATGAAGTCA AAGCTGAAGG TGTCCCGGAC TGGCTTTGCC CGCATCGCAG TTTTGAGGGG 
AATCGCCCCA CCAATACGAT ACTTGCCGAG CGCCTCACAC CCCACACCCT CGGTGCCCTT 
GTCGCTCTTT ATGAGCAGAG TGTTTTTACA CAGGGGACAA TCTGGCAGAT CGATTCGTTC 
GATCAATGGG GCGTCGAACT CGGCAAAGTG CTGGCACACC GCATCGGGCA GGAACTGGAG 
GATGAAAACG GCAAGTCCCT GAAACATGAT AGCTCCACCA ACGCCCTGAT ACAGCGGTAC 
AACAGGCTGA AACAAAAATA G

Protein sequence

MTKPMITPLT QRPAWKALEA HYQTIKGMHL RQLFADDPKR GERFTAEAVG LYLDYSKNRI 
TDETLHLLVQ LAEECGLRER IEAMFRGDAI NVTEQRAVLH IALRAPRNEK ILVDGNDVVP 
GVHAVLDRMA DFSDKIRSGD WQGHTGKRIR NIINIGIGGS DLGPVMAYEA LRHYSLHNLS 
FRFISNVDGT DFVEATRGLD PEETLFIICS KTFTTTETLA NAHTARRWML RQIKDLEGVR 
KHFVAVSTNA EEVARFGIDT ANMFEFWDWV GGRYSMDSAI GLSTMIAVGP ENFREMLAGF 
HAMDQHFYSA PFDRNLPVLM GLLSLWYNNF FGAQTLAVLP YEQYLKRFPA YLQQLTMESN 
GKHITLNGSQ VDYQTSPIVW GEPGTNGQHS FYQLIHQGTR LIPCDFIGFC QTLNPLGDHH 
DLLMANLFAQ TEALAFGKTE DEVKAEGVPD WLCPHRSFEG NRPTNTILAE RLTPHTLGAL 
VALYEQSVFT QGTIWQIDSF DQWGVELGKV LAHRIGQELE DENGKSLKHD SSTNALIQRY 
NRLKQK