Gene EcSMS35_3422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3422
Symbol	garP
ID	6146497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3503409
End bp	3504743
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	51%
IMG OID	641618251
Product	galactarate permease GarP
Protein accession	YP_001745400
Protein GI	170683081
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00893] d-galactonate transporter

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCTGG ACACCGTTGA CGTAAAAAAG AAAGGCGTGC ATACCCGCTA TTTAATATTA 
CTGATTATTT TTATTGTTAC CGCCGTTAAC TACGCCGATC GTGCAACGCT GTCTATTGCT 
GGTACCGAAG TGGCAAAAGA GTTGCAGTTA AGTGCGGTTT CGATGGGTTA CATCTTCTCC 
GCTTTTGGCT GGGCCTACCT GCTGATGCAA ATTCCCGGCG GCTGGCTGCT TGATAAGTTT 
GGCTCGAAAA AAGTTTACAC CTACAGCCTC TTTTTCTGGT CGCTGTTCAC CTTCCTGCAA 
GGCTTTGTTG ATATGTTCCC GCTGGCCTGG GCAGGGATCT CCATGTTCTT TATGCGCTTT 
ATGCTGGGGT TCTCGGAAGC GCCATCATTC CCGGCGAACG CCCGTATTGT CGCCGCCTGG 
TTCCCAACGA AAGAACGTGG TACTGCCTCC GCCATCTTTA ACTCGGCGCA ATATTTCTCG 
CTGGCGCTCT TTTCGCCGCT GCTTGGCTGG CTGACTTTCG CCTGGGGCTG GGAGCACGTC 
TTCACCGTTA TGGGGGTGAT TGGTTTTGTG CTGACGGCGC TGTGGATCAA GTTGATTCAT 
AACCCGACAG ATCACCCACG TATGTCTGCG GAAGAGCTGA AGTTTATCTC AGAAAATGGC 
GCGGTGGTCG ATATGGACCA CAAAAAGCCG GGCAGTGCGG CAGCAAGCGG TCCCAAACTG 
CATTACATCA AGCAATTGCT CTCTAACCGC ATGATGCTGG GCGTATTTTT CGGACAATAT 
TTTATCAACA CCATCACCTG GTTCTTCCTC ACCTGGTTCC CAATTTATCT GGTGCAGGAA 
AAAGGCATGT CGATTCTGAA AGTGGGTCTG GTCGCCTCGA TTCCGGCACT GTGTGGCTTT 
GCGGGCGGCG TACTGGGAGG TGTCTTCTCG GATTATCTGA TCAAACGCGG TTTGTCCCTG 
ACCCTGGCAC GTAAGCTACC GATTGTGCTG GGAATGTTGC TGGCTTCCAC CATTATCTTA 
TGTAACTACA CCAACAACAC CACGCTAGTG GTCATGCTGA TGGCGCTGGC TTTCTTTGGC 
AAAGGATTTG GTGCGCTGGG CTGGCCGGTA ATTTCTGACA CCGCGCCGAA AGAGATTGTT 
GGTCTCTGCG GCGGCGTCTT TAACGTCTTT GGCAATGTTG CCTCCATTGT CACTCCACTG 
GTGATTGGCT ACCTGGTAAG TGAATTGCAC TCCTTCAATG CAGCACTGGT TTTCGTGGGA 
TGTTCAGCGC TGATGGCGAT GGTCTGCTAC CTCTTCGTAG TTGGCGACAT TAAACGTATG 
GAATTGCAGA AATAA

Protein sequence

MILDTVDVKK KGVHTRYLIL LIIFIVTAVN YADRATLSIA GTEVAKELQL SAVSMGYIFS 
AFGWAYLLMQ IPGGWLLDKF GSKKVYTYSL FFWSLFTFLQ GFVDMFPLAW AGISMFFMRF 
MLGFSEAPSF PANARIVAAW FPTKERGTAS AIFNSAQYFS LALFSPLLGW LTFAWGWEHV 
FTVMGVIGFV LTALWIKLIH NPTDHPRMSA EELKFISENG AVVDMDHKKP GSAAASGPKL 
HYIKQLLSNR MMLGVFFGQY FINTITWFFL TWFPIYLVQE KGMSILKVGL VASIPALCGF 
AGGVLGGVFS DYLIKRGLSL TLARKLPIVL GMLLASTIIL CNYTNNTTLV VMLMALAFFG 
KGFGALGWPV ISDTAPKEIV GLCGGVFNVF GNVASIVTPL VIGYLVSELH SFNAALVFVG 
CSALMAMVCY LFVVGDIKRM ELQK