Gene SeHA_C4119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4119
Symbol	uhpC
ID	6489721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4001923
End bp	4003251
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	60%
IMG OID	642744215
Product	regulatory protein UhpC
Protein accession	YP_002047819
Protein GI	194449259
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00881] phosphoglycerate transporter family protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	103
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTTCGT TTTTAAAAGC CCCGGCCAAC GCGCCGCTCA TCACCGATAA GCACGAGGTT 
GACGCCCGCT ATCGCTACTG GCGGCGGCAT ATCCTGATCA CCATTTGGTT GGGTTACGCG 
CTGTTCTATT TCACCCGTAA AAGCTTTAAC GCCGCCGCGC CGGAAATCCT TGCCAGCGGC 
ATTCTGACCC GCAGCGATAT CGGCCTGCTG GCGACGCTGT TTTACATCAC CTACGGGGTG 
TCGAAATTTG TCTCCGGCAT CGTTAGCGAT CGCTCTAACG CTCGCTATTT TATGGGCATC 
GGGCTGATTG CGACTGGCGT AGTGAATATT CTGTTCGGCT TCTCGACCTC GCTGTGGGCC 
TTTGCTCTGC TATGGGCGCT GAACGCCTTT TTCCAGGGGT TTGGATCGCC GGTTTGCGCC 
CGTTTGCTGA CTGCCTGGTA CTCGCGTACC GAGCGCGGCG GCTGGTGGGC GTTATGGAAT 
ACCGCGCACA ATGTCGGCGG GGCGCTGATC CCTCTCGTTA TGGCCGCTGT CGCCCTGCAT 
TATGGCTGGC GCGTCGGAAT GATGGTGGCC GGGTTGCTTG CCATCGGGGT GGGCATGGTC 
CTCTGCTGGC GGCTGCGCGA CCGTCCGCAG GCGATTGGTT TACCGCCGGT AGGCGACTGG 
CGGCACGATG CGCTGGAGGT CGCCCAACAG CAAGAGGGCG CGGGGCTAAG TCGCAAAGAA 
ATCCTCGCTA AATATGTGCT GTTGAATCCC TATATCTGGC TGCTTTCGTT GTGTTATGTC 
TTAGTGTACG TGGTGCGCGC GGCGATCAAC GACTGGGGCA ACCTGTATAT GTCCGAGACG 
CTGGGCGTAG ATTTGGTCAC GGCCAACACG GCAGTATCGA TGTTTGAGCT GGGTGGATTT 
ATCGGTGCGC TGGTGGCGGG CTGGGGCTCG GACAAACTCT TCAACGGCAA CCGCGGACCG 
ATGAATTTAA TCTTCGCCGC CGGGATTTTG CTCTCTGTGG GTTCGCTGTG GCTGATGCCG 
TTCGCCAGCT ACGTGATGCA GGCGGCCTGT TTCTTCACCA CCGGTTTCTT TGTCTTCGGC 
CCGCAGATGC TCATTGGCAT GGCGGCGGCG GAGTGCTCGC ATAAAGAGGC GGCGGGCGCG 
GCCACCGGCT TTGTCGGCCT GTTCGCCTAT CTCGGCGCGT CGCTTTCCGG CTGGCCGTTA 
GCGAAAGTGC TGGAGATCTG GCACTGGACC GGTTTTTTTG CGGTCATCGC CATCGCGGCG 
GGGATCTCCG CGCTATTGCT GTTGCCATTT CTGAACGCTC AGGCCCCACG CGAGACCCAC 
GAAGCGTGA

Protein sequence

MLSFLKAPAN APLITDKHEV DARYRYWRRH ILITIWLGYA LFYFTRKSFN AAAPEILASG 
ILTRSDIGLL ATLFYITYGV SKFVSGIVSD RSNARYFMGI GLIATGVVNI LFGFSTSLWA 
FALLWALNAF FQGFGSPVCA RLLTAWYSRT ERGGWWALWN TAHNVGGALI PLVMAAVALH 
YGWRVGMMVA GLLAIGVGMV LCWRLRDRPQ AIGLPPVGDW RHDALEVAQQ QEGAGLSRKE 
ILAKYVLLNP YIWLLSLCYV LVYVVRAAIN DWGNLYMSET LGVDLVTANT AVSMFELGGF 
IGALVAGWGS DKLFNGNRGP MNLIFAAGIL LSVGSLWLMP FASYVMQAAC FFTTGFFVFG 
PQMLIGMAAA ECSHKEAAGA ATGFVGLFAY LGASLSGWPL AKVLEIWHWT GFFAVIAIAA 
GISALLLLPF LNAQAPRETH EA