Gene ECD_02992 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02992
Symbol	garP
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	3139767
End bp	3141101
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	51%
IMG OID
Product	predicted (D)-galactarate transporter
Protein accession	ACT44796
Protein GI	253979126
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCTGG ACACTGTTGA CGAAAAAAAG AAAGGCGTGC ATACCCGCTA TTTAATATTA 
CTGATTATTT TTATTGTTAC CGCCGTTAAC TACGCCGATC GTGCAACGCT GTCTATTGCT 
GGTACCGAAG TGGCAAAAGA GTTGCAGTTA AGTGCGGTTT CGATGGGTTA CATCTTCTCC 
GCTTTTGGCT GGGCCTACTT GCTGATGCAA ATCCCCGGCG GCTGGCTGCT TGATAAGTTT 
GGCTCGAAAA AAGTTTACAC CTACAGCCTC TTTTTCTGGT CGCTATTCAC CTTCCTGCAA 
GGCTTTGTTG ATATGTTCCC GCTGGCCTGG GCAGGGATCT CCATGTTCTT TATGCGCTTT 
ATGCTCGGCT TCTCGGAAGC GCCATCATTC CCGGCGAACG CCCGAATTGT CGCCGCCTGG 
TTCCCGACGA AAGAACGTGG TACTGCCTCC GCCATCTTTA ACTCGGCGCA ATATTTCTCG 
CTGGCGCTCT TTTCGCCGCT GCTTGGCTGG CTGACTTTCG CCTGGGGCTG GGAGCACGTC 
TTTACCGTTA TGGGGGTGAT TGGTTTTGTG CTGACGGCGC TGTGGATCAA GTTGATTCAT 
AACCCGACAG ATCACCCACG TATGTCTGCG GAAGAGCTGA AGTTTATCTC TGAAAATGGC 
GCGGTGGTCG ATATGGACCA CAAAAAGCCG GGCAGTGCGG CAGCAAGCGG ACCCAAACTG 
CATTACATCA AGCAATTGCT CTCTAACCGC ATGATGCTGG GCGTATTTTT CGGACAATAT 
TTTATCAACA CCATCACCTG GTTCTTCCTC ACCTGGTTCC CGATTTATCT GGTGCAGGAA 
AAAGGCATGT CGATTCTGAA AGTGGGTCTG GTCGCCTCGA TTCCAGCACT GTGTGGTTTT 
GCGGGCGGCG TGCTGGGAGG TGTCTTCTCG GATTATCTGA TCAAACGCGG TTTATCCCTG 
ACCCTGGCAC GTAAGCTACC GATTGTGCTG GGAATGTTGC TGGCTTCCAC CATCATCTTA 
TGTAACTACA CCAACAACAC CACGCTGGTG GTCATGCTGA TGGCGCTGGC TTTCTTTGGC 
AAAGGATTTG GTGCGCTGGG CTGGCCGGTG ATTTCTGACA CCGCGCCGAA AGAGATTGTT 
GGCCTCTGCG GCGGCGTCTT TAACGTCTTT GGCAATGTTG CCTCCATTGT CACTCCACTG 
GTGATTGGCT ACCTGGTAAG TGAACTGCAC TCCTTCAATG CAGCACTGGT TTTCGTGGGA 
TGTTCAGCGC TGATGGCGAT GGTCTGCTAC CTCTTCGTAG TTGGCGACAT TAAACGTATG 
GAATTGCAGA AATAA

Protein sequence

MILDTVDEKK KGVHTRYLIL LIIFIVTAVN YADRATLSIA GTEVAKELQL SAVSMGYIFS 
AFGWAYLLMQ IPGGWLLDKF GSKKVYTYSL FFWSLFTFLQ GFVDMFPLAW AGISMFFMRF 
MLGFSEAPSF PANARIVAAW FPTKERGTAS AIFNSAQYFS LALFSPLLGW LTFAWGWEHV 
FTVMGVIGFV LTALWIKLIH NPTDHPRMSA EELKFISENG AVVDMDHKKP GSAAASGPKL 
HYIKQLLSNR MMLGVFFGQY FINTITWFFL TWFPIYLVQE KGMSILKVGL VASIPALCGF 
AGGVLGGVFS DYLIKRGLSL TLARKLPIVL GMLLASTIIL CNYTNNTTLV VMLMALAFFG 
KGFGALGWPV ISDTAPKEIV GLCGGVFNVF GNVASIVTPL VIGYLVSELH SFNAALVFVG 
CSALMAMVCY LFVVGDIKRM ELQK