Gene SeHA_C1942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C1942
Symbol	galU
ID	6489462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	1895632
End bp	1896540
Gene Length	909 bp
Protein Length	302 aa
Translation table	11
GC content	50%
IMG OID	642742152
Product	UTP--glucose-1-phosphate uridylyltransferase subunit GalU
Protein accession	YP_002045797
Protein GI	194450744
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1210] UDP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR01099] UTP-glucose-1-phosphate uridylyltransferase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.261288
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	0.966248
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCCC TTAATTCGAA AGTCAAAAAA GCCGTTATCC CGGTCGCGGG ATTGGGAACC 
AGGATGCTGC CAGCGACCAA AGCTATCCCG AAAGAGATGC TGCCGCTGGT TGATAAGCCA 
TTAATTCAGT ACGTCGTGAA CGAATGTATC GCTGCTGGCA TTACTGAAAT CGTGCTTGTT 
ACGCACTCGT CTAAAAACTC TATTGAAAAC CACTTTGATA CCAGTTTTGA GCTGGAAGCG 
ATGCTGGAAA AACGCGTTAA GCGTCAGCTT CTGGAGGAGG TTCAGTCTAT TTGCCCTCCG 
CATGTCACTA TTATGCAGGT ACGTCAAGGG CTGGCAAAAG GCCTGGGCCA TGCCGTATTG 
TGCGCGCATC CCGTTGTCGG AAACGAACCT GTCGCTGTTA TTCTGCCAGA CGTTATTCTT 
GACGAATATG AGTCCGACCT GTCTCAGGAT AACCTGGCTG AAATGATCCG CCGTTTTGAC 
GAAACCGGCA ATAGCCAGAT TATGGTTGAG CCGGTAGAAG ATGTGACTGC ATACGGCGTG 
GTCGATTGTA AAGGCGTTGA GCTGGCGCCG GGCGAAAGTG TGCCGATGGT TGGCGTGGTT 
GAAAAACCAA AAGCGGATGT CGCGCCGTCT AACCTTGCGA TTGTCGGGCG TTATGTGTTG 
AGCGCGGATA TCTGGGCGTT GCTGGCGAAA ACCCCTCCGG GCGCCGGGGA TGAAATTCAG 
TTGACCGATG CTATCGATAT GCTGATCGAA AAAGAAACGG TTGAAGCCTA CCACATGAAG 
GGTAAAAGCC ATGACTGTGG TAATAAGTTA GGATATATGC AGGCATTCGT TGAATATGGC 
ATCCGTCATA ATTCGCTGGG TGCTGAATTT AAAGCCTGGC TTGAAGAAGA AATGGGTATT 
AAGAAGTAA

Protein sequence

MAALNSKVKK AVIPVAGLGT RMLPATKAIP KEMLPLVDKP LIQYVVNECI AAGITEIVLV 
THSSKNSIEN HFDTSFELEA MLEKRVKRQL LEEVQSICPP HVTIMQVRQG LAKGLGHAVL 
CAHPVVGNEP VAVILPDVIL DEYESDLSQD NLAEMIRRFD ETGNSQIMVE PVEDVTAYGV 
VDCKGVELAP GESVPMVGVV EKPKADVAPS NLAIVGRYVL SADIWALLAK TPPGAGDEIQ 
LTDAIDMLIE KETVEAYHMK GKSHDCGNKL GYMQAFVEYG IRHNSLGAEF KAWLEEEMGI 
KK