Gene EcolC_2904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2904
Symbol
ID	6065383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3164538
End bp	3165584
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	56%
IMG OID	641602309
Product	galactose-1-phosphate uridylyltransferase
Protein accession	YP_001725858
Protein GI	170020904
COG category	[C] Energy production and conversion
COG ID	[COG1085] Galactose-1-phosphate uridylyltransferase
TIGRFAM ID	[TIGR00209] galactose-1-phosphate uridylyltransferase, family 1

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.23532
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAAT TTAATCCCGT TGATCATCCA CATCGCCGCT ACAACCCGCT CACCGGGCAA 
TGGATTCTGG TTTCACCGCA CCGCGCTAAG CGCCCCTGGC AGGGGGCGCA GGAAACGCCA 
GCCAAACAGG TGTTACCTGC GCACGATCCA GATTGCTTCC TCTGCGCAGG TAATGTGCGG 
GTGACAGGCG ATAAAAACCC CGATTACACC GGGACTTACG TTTTCACTAA TGACTTTGCG 
GCTTTGATGT CTGACACGCC AGATGCGCCA GAAAGTCACG ATCCGCTGAT GCGTTGCCAG 
AGCGCGCGCG GCACCAGCCG GGTGATCTGC TTTTCACCGG ATCACAGTAA AACGCTGCCA 
GAGCTCAGCG TTGCAGCATT GACGGAAATC GTCAAAACCT GGCAGGAGCA AACCGCAGAA 
CTGGGGAAAA CGTACCCATG GGTGCAGGTT TTTGAAAACA AAGGCGCGGC GATGGGCTGC 
TCTAACCCGC ATCCGCACGG TCAGATTTGG GCAAATAGCT TCCTGCCTAA CGAAGCTGAG 
CGCGAAGACC GCCTGCAAAA AGAATATTTT GCCGAACAGA AATCACCAAT GCTGGTGGAT 
TATGTTCAGC GCGAGCTGGC AGACGGTAGC CGTACCGTTG TCGAAACCGA ACACTGGTTA 
GCCGTCGTGC CTTACTGGGC TGCCTGGCCG TTCGAAACGC TACTGCTGCC CAAAGCCCAC 
GTTTTACGGA TCACCGATTT GACCGACGCC CAGCGCAGCG ATCTGGCGCT GGCGTTGAAA 
AAGCTGACCA GTCGTTATGA CAACCTCTTC CAGTGCTCCT TCCCCTACTC TATGGGCTGG 
CACGGCGCGC CATTTAATGG CGAAGAGAAT CAACACTGGC AGCTGCACGC GCACTTTTAT 
CCGCCTCTGC TGCGCTCCGC CACCGTACGT AAATTTATGG TTGGTTATGA AATGCTGGCA 
GAGACCCAGC GAGACCTGAC CGCAGAACAG GCAGCAGAGC GTTTGCGCGC AGTCAGCGAT 
ATCCATTTTC GCGAATCCGG AGTGTAA

Protein sequence

MTQFNPVDHP HRRYNPLTGQ WILVSPHRAK RPWQGAQETP AKQVLPAHDP DCFLCAGNVR 
VTGDKNPDYT GTYVFTNDFA ALMSDTPDAP ESHDPLMRCQ SARGTSRVIC FSPDHSKTLP 
ELSVAALTEI VKTWQEQTAE LGKTYPWVQV FENKGAAMGC SNPHPHGQIW ANSFLPNEAE 
REDRLQKEYF AEQKSPMLVD YVQRELADGS RTVVETEHWL AVVPYWAAWP FETLLLPKAH 
VLRITDLTDA QRSDLALALK KLTSRYDNLF QCSFPYSMGW HGAPFNGEEN QHWQLHAHFY 
PPLLRSATVR KFMVGYEMLA ETQRDLTAEQ AAERLRAVSD IHFRESGV