Gene EcolC_0189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0189
Symbol
ID	6064418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	211207
End bp	212493
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	52%
IMG OID	641599590
Product	C4-dicarboxylate transporter DctA
Protein accession	YP_001723197
Protein GI	170018243
COG category	[C] Energy production and conversion
COG ID	[COG1301] Na+/H+-dicarboxylate symporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCT CTCTGTTTAA AAGCCTTTAC TTTCAGGTCC TGACAGCGAT AGCCATTGGT 
ATTCTCCTTG GCCATTTCTA TCCTGAAATA GGCGAGCAAA TGAAACCGCT TGGCGACGGC 
TTCGTTAAGC TCATTAAGAT GATCATCGCT CCTGTCATCT TTTGTACCGT CGTAACGGGC 
ATTGCGGGCA TGGAAAGCAT GAAGGCGGTC GGTCGTACCG GCGCAGTCGC ACTGCTTTAC 
TTTGAAATTG TCAGTACCAT CGCGCTGATT ATTGGTCTTA TCATCGTTAA CGTCGTGCAG 
CCTGGTGCCG GAATGAACGT CGATCCGGCA ACGCTTGATG CGAAAGCGGT AGCGGTTTAC 
GCCGATCAGG CGAAAGACCA GGGCATTGTC GCCTTCATTA TGGATGTCAT CCCGGCGAGC 
GTCATTGGCG CATTTGCCAG CGGTAACATT CTGCAGGTGC TGCTGTTTGC CGTACTGTTT 
GGTTTTGCGC TCCACCGTCT GGGCAGCAAA GGCCAACTGA TTTTTAACGT CATCGAAAGT 
TTCTCGCAGG TCATCTTCGG CATCATCAAT ATGATCATGC GTCTGGCACC TATTGGTGCG 
TTCGGGGCAA TGGCGTTTAC CATCGGTAAA TACGGCGTCG GCACACTGGT GCAACTGGGG 
CAGCTGATTA TCTGTTTCTA CATTACCTGT ATCCTGTTTG TGGTGCTGGT ATTGGGTTCA 
ATCGCTAAAG CGACTGGTTT CAGTATCTTC AAATTTATCC GCTACATCCG TGAAGAACTG 
CTGATTGTAC TGGGGACTTC ATCTTCCGAG TCGGCGCTGC CGCGTATGCT CGACAAGATG 
GAGAAACTCG GCTGCCGTAA ATCGGTGGTG GGGCTGGTCA TCCCGACAGG CTACTCGTTT 
AACCTTGATG GCACATCGAT ATACCTGACA ATGGCGGCGG TGTTTATCGC CCAGGCCACT 
AACAGTCAGA TGGATATCGT CCACCAAATC ACGCTGTTAA TCGTGTTGCT GCTTTCTTCT 
AAAGGGGCGG CAGGGGTAAC GGGTAGTGGC TTTATCGTGC TGGCGGCGAC GCTCTCTGCG 
GTGGGCCATT TGCCGGTAGC GGGTCTGGCG CTGATCCTCG GTATCGACCG CTTTATGTCA 
GAAGCTCGTG CGCTGACTAA CCTGGTCGGT AACGGCGTAG CGACCATTGT CGTTGCTAAG 
TGGGTGAAAG AACTGGACCA CAAAAAACTG GACGATGTGC TGAATAATCG TGCGCCGGAT 
GGCAAAACGC ACGAATTATC CTCTTAA

Protein sequence

MKTSLFKSLY FQVLTAIAIG ILLGHFYPEI GEQMKPLGDG FVKLIKMIIA PVIFCTVVTG 
IAGMESMKAV GRTGAVALLY FEIVSTIALI IGLIIVNVVQ PGAGMNVDPA TLDAKAVAVY 
ADQAKDQGIV AFIMDVIPAS VIGAFASGNI LQVLLFAVLF GFALHRLGSK GQLIFNVIES 
FSQVIFGIIN MIMRLAPIGA FGAMAFTIGK YGVGTLVQLG QLIICFYITC ILFVVLVLGS 
IAKATGFSIF KFIRYIREEL LIVLGTSSSE SALPRMLDKM EKLGCRKSVV GLVIPTGYSF 
NLDGTSIYLT MAAVFIAQAT NSQMDIVHQI TLLIVLLLSS KGAAGVTGSG FIVLAATLSA 
VGHLPVAGLA LILGIDRFMS EARALTNLVG NGVATIVVAK WVKELDHKKL DDVLNNRAPD 
GKTHELSS