Gene Saro_1809 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1809
Symbol	pgi
ID	3918368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1907699
End bp	1909222
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	67%
IMG OID	640444550
Product	glucose-6-phosphate isomerase
Protein accession	YP_497083
Protein GI	87199826
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0166] Glucose-6-phosphate isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.850311
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGTTG CCGAAGCGGA AACGTACTGG ACGGCGCTGG CCGGGCTGCC GCGCCCGACG 
CTCAAGGAGC TGTTCTCCGA TGCCGGCCGT CTCGATCGCT ACGCCGCTAC GCTCGACCTG 
CCGGGCGGCC CGATCCGCTT CGACTGGTCC AAGACGCACC TCTCCGCCGA AGTGGAAGCG 
GTGTTCGCCG CGCTTGCATC GGCGATGGAC TTCGAAGGCC GCCGCGCCGC GCTGATCGAG 
GGCGCGAAAA TCAACAACAC CGAAGGCCGC GCGGCCGAGC ACACCGCTCA GCGCGGCATC 
GGCAACGAGG CCAGCGTCGA GGAAGCCGAG GCGCTCCACG CCCGCATGCG CATGCTGGTC 
GACGCGATCC ACGCCGGTGC GCTTGGCGAA GTGCGCAGCC TGATCCACAT TGGCATCGGC 
GGTTCGGCGC TCGGGCCGGC GCTGGCGATC GACGCACTGA CCCGCGACGG CGCGAAGGTG 
GCCGTCCACG TCGTGTCGAA CATCGACGGC TGCGCGCTCG AAGCCGCTAT GAAGGCCTGC 
GATCCGGCAA CGACGATGAT CGCCGTTGCC TCCAAGACCT TCACCACGAC CGAGACGATG 
ACCAACGCTG CCTCGGCGCT TGAATGGCTG CGCGAGAACG GCGTTGCCGA TCCCTATGGC 
CAGGTCGTTG CGCTCACCGC CGCGCCCGAG AAGGCGGTCG AGTGGGGCGT CGACGAAACC 
CGCGTCCTGC CGTTCTCCGA AACCGTGGGC GGGCGTTACT CGCTGTGGTC GTCGATCGGT 
TTCCCGGTCG CGATGGCGCT GGGGTGGGAA GGCTTCGCCG CGTTCCTCGA CGGTGCGGCG 
GCTATCGATC GCCATTTCAT CGACGCAGAC CTGGCCGGCA ACGTCGTCGT TCGCGCCGCC 
TTTGCCGATC TCTATTACAC TCAGGTTCGC GGGTGCCAGA CGCGTGCGGT CTTCGCCTAT 
GACGAACGCC TCGCGCTTCT GCCGGACTAT CTCCAGCAGC TCGAAATGGA ATCAAACGGC 
AAGCGCGTCC TCGCCGATGG CTCTCCACTT ACACGGCCAA GCGCGCCGGT TACCTGGGGC 
GGCGTCGGGA CCGATGCACA GCATGCCGTG TTCCAGCTCC TGCACCAGGG TACGCACTTG 
ATTCCGGTCG ATTTCCTTGC CGTCAAGACG CAGGGCCACG ACCTCGACCC GGCGCATCAC 
CAGATCCTGC TTTCCAACTG CTTCGCCCAG GGTGCTGCGC TCATGGCCGG CAAGGCGAGC 
GATGACGGCG CGCGTGCCTA TCCCGGCGAC CGTCCTTCCG CGACGATCCT GTGCGACGAT 
CTCAACCCCG CGACGCTCGG CGCGCTGATC GCCTTCCACG AGCATCGCAC GTTCGTCTCT 
GCGGTGATGC TCGGCATCAA TCCCTTCGAC CAGTTCGGCG TCGAACTGGG CAAGGCCATT 
GCCAAGCAGA TCGAGTCTGG CGGCGGCGAA GGCTTCGATC CGTCGACCGA AGCACTCCTG 
GCAGCGGTTG GCCTCGCCGG CTGA

Protein sequence

MTVAEAETYW TALAGLPRPT LKELFSDAGR LDRYAATLDL PGGPIRFDWS KTHLSAEVEA 
VFAALASAMD FEGRRAALIE GAKINNTEGR AAEHTAQRGI GNEASVEEAE ALHARMRMLV 
DAIHAGALGE VRSLIHIGIG GSALGPALAI DALTRDGAKV AVHVVSNIDG CALEAAMKAC 
DPATTMIAVA SKTFTTTETM TNAASALEWL RENGVADPYG QVVALTAAPE KAVEWGVDET 
RVLPFSETVG GRYSLWSSIG FPVAMALGWE GFAAFLDGAA AIDRHFIDAD LAGNVVVRAA 
FADLYYTQVR GCQTRAVFAY DERLALLPDY LQQLEMESNG KRVLADGSPL TRPSAPVTWG 
GVGTDAQHAV FQLLHQGTHL IPVDFLAVKT QGHDLDPAHH QILLSNCFAQ GAALMAGKAS 
DDGARAYPGD RPSATILCDD LNPATLGALI AFHEHRTFVS AVMLGINPFD QFGVELGKAI 
AKQIESGGGE GFDPSTEALL AAVGLAG