Gene SbBS512_E1401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1401
Symbol	galU
ID	6272858
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	1280349
End bp	1281257
Gene Length	909 bp
Protein Length	302 aa
Translation table	11
GC content	47%
IMG OID	641725506
Product	UTP--glucose-1-phosphate uridylyltransferase subunit GalU
Protein accession	YP_001880015
Protein GI	187731530
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1210] UDP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR01099] UTP-glucose-1-phosphate uridylyltransferase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGCCA TTAATACGAA AGTCAAAAAA GCCGTTATCC CCGTTGCGGG ATTAGGAACC 
AGGATGTTGC CGGCGACGAA AGCCATCCCG AAAGAGATGC TGCCACTTGT CGATAAGCCA 
TTAATTCAAT ACGTCGTGAA TGAATGTATT GCGGCTGGCA TTACTGAAAT TGTGCTGGTT 
ACGCACTCAT CTAAAAACTC GATTGAAAAC CACTTTGATA CCAGTTTTGA ACTGGAAGCA 
ATGCTGGAAA AACGTGTAAA ACGTCAACTG CTTGATGAAG TGCAGTCTAT TTGTCCGCCG 
CACGTGACTA TTATGCAAGT TCGTCAGGGG CTGGCGAAAG GCCTGGGACA CGCGGTATTG 
TGTGCTCACC CGGTAGTGGG TGATGAACCG GTAGCTGTTA TTTTGCCTGA TGTTATTCTG 
GATGAATATG AATCCGATTT GTCACAGGAT AACCTAGCAG AGATGATCCG CCGCTTTGAT 
GAAACGGGTC ATAGCCAGAT CATGGTTGAA CAGGTTGCTG ATGTGACCGC ATATGGCGTT 
GTGGATTGCA AAGGCGTTGA ATTAGCGCCG GGTGAAAGTG TACCGATGGT TGGTGTGGTA 
GAAAAACCGA AAGCGGATGT TGCGCCGTCT AATCTCGCTA TTGTGGGTCG TTACGTACTT 
AGCGCGGATA TTTGGCCGTT GCTGGCAAAA ACCCCTCCGG GAGCTGGTGA TGAAATTCAG 
CTCACCGACG CAATTGATAT GCTGATCGAA AAAGAAACGG TGGAAGCCTA TCATATGAAA 
GGGAAGAGCC ATGACTGCGG TAATAAATTA GGTTACATGC AGGCCTTCGT TGAATACGGT 
ATTCGTCATA ACACCCTTGG CACGGAATTT AAAGCCTGGC TTGAAGAAGA GATGGGCATT 
AAGAAGTAA

Protein sequence

MAAINTKVKK AVIPVAGLGT RMLPATKAIP KEMLPLVDKP LIQYVVNECI AAGITEIVLV 
THSSKNSIEN HFDTSFELEA MLEKRVKRQL LDEVQSICPP HVTIMQVRQG LAKGLGHAVL 
CAHPVVGDEP VAVILPDVIL DEYESDLSQD NLAEMIRRFD ETGHSQIMVE QVADVTAYGV 
VDCKGVELAP GESVPMVGVV EKPKADVAPS NLAIVGRYVL SADIWPLLAK TPPGAGDEIQ 
LTDAIDMLIE KETVEAYHMK GKSHDCGNKL GYMQAFVEYG IRHNTLGTEF KAWLEEEMGI 
KK