Gene EcHS_A3903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3903
Symbol
ID	5591956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3897609
End bp	3898946
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	53%
IMG OID	640923011
Product	d-galactonate transporter
Protein accession	YP_001460488
Protein GI	157163170
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00881] phosphoglycerate transporter family protein [TIGR00893] d-galactonate transporter

Plasmid Coverage information

Num covering plasmid clones	68
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGAGCG GCTTCGCTAT GCCCAAAATC TGGAGAAAGC TCGCTATGGA TATTCCCGTT 
AATGCAGCAA AGCCGGGGCG TCGGCGTTAT CTGACGCTGG TGATGATCTT TATTACGGTG 
GTCATTTGTT ATGTTGACCG CGCTAACCTG GCCGTGGCTT CCGCCCATAT TCAGGAAGAG 
TTCGGTATTA CCAAAGCGGA AATGGGCTAT GTATTTTCGG CCTTCGCCTG GCTTTATACG 
CTATGTCAGA TCCCCGGCGG TTGGTTTTTA GATCGCGTAG GTTCTCGCGT GACTTATTTT 
ATTGCGATAT TTGGCTGGTC AGTGGCGACT TTATTCCAGG GCTTTGCCAC GGGATTAATG 
TCATTAATTG GTCTGCGCGC GATAACCGGT ATTTTCGAAG CGCCCGCTTT CCCGACCAAT 
AACCGGATGG TGACCAGCTG GTTCCCGGAA CATGAACGCG CTTCTGCCGT TGGTTTTTAT 
ACGTCTGGTC AGTTTGTCGG TCTGGCGTTT CTGACTCCGC TGCTGATCTG GATTCAGGAG 
ATGTTGAGCT GGCACTGGGT GTTCATTGTC ACCGGTGGTA TCGGCATTAT CTGGTCGCTG 
ATTTGGTTTA AGGTTTATCA GCCGCCGCGC CTGACCAAAG GTATCAGCAA AGCTGAACTG 
GATTACATTC GTGATGGCGG CGGTCTGGTG GATGGCGATG CGCCGGTGAA AAAAGAGGCA 
CGTCAGCCGT TAACAGCCAA AGACTGGAAA CTGGTGTTTC ATCGTAAACT GATCGGCGTC 
TATCTTGGGC AATTTGCGGT GGCTTCTACA CTGTGGTTTT TCTTAACCTG GTTCCCGAAC 
TATTTAACCC AGGAAAAAGG AATCACGGCG CTGAAAGCAG GCTTTATGAC CACGGTGCCA 
TTCCTCGCGG CGTTTGTCGG CGTCCTGCTC TCTGGCTGGG TCGCGGATCT GCTGGTACGT 
AAGGGCTTTT CACTGGGCTT TGCGCGTAAA ACGCCGATTA TCTGCGGCTT GCTGATCTCC 
ACCTGCATTA TGGGCGCTAA CTACACTAAC GATCCGATGA TGATTATGTG CCTGATGGCG 
CTGGCATTCT TCGGCAACGG TTTTGCTTCG ATTACCTGGT CGCTGGTCTC TTCTCTGGCA 
CCGATGCGCC TGATTGGTTT AACCGGCGGC GTGTTTAACT TCGCCGGTGG TCTGGGCGGC 
ATCACCGTTC CGCTGGTGGT GGGGTACCTG GCGCAGGGTT ACGGTTTCGC ACCTGCACTG 
GTTTATATCT CCGCCGTCGC GTTGATTGGC GCGCTCTCTT ACATCCTGCT GGTGGGCGAT 
GTGAAGCGCG TTGGATAA

Protein sequence

MVSGFAMPKI WRKLAMDIPV NAAKPGRRRY LTLVMIFITV VICYVDRANL AVASAHIQEE 
FGITKAEMGY VFSAFAWLYT LCQIPGGWFL DRVGSRVTYF IAIFGWSVAT LFQGFATGLM 
SLIGLRAITG IFEAPAFPTN NRMVTSWFPE HERASAVGFY TSGQFVGLAF LTPLLIWIQE 
MLSWHWVFIV TGGIGIIWSL IWFKVYQPPR LTKGISKAEL DYIRDGGGLV DGDAPVKKEA 
RQPLTAKDWK LVFHRKLIGV YLGQFAVAST LWFFLTWFPN YLTQEKGITA LKAGFMTTVP 
FLAAFVGVLL SGWVADLLVR KGFSLGFARK TPIICGLLIS TCIMGANYTN DPMMIMCLMA 
LAFFGNGFAS ITWSLVSSLA PMRLIGLTGG VFNFAGGLGG ITVPLVVGYL AQGYGFAPAL 
VYISAVALIG ALSYILLVGD VKRVG