Gene EcSMS35_3836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3836
Symbol	dctA
ID	6146394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3906699
End bp	3907985
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	52%
IMG OID	641618662
Product	C4-dicarboxylate transporter DctA
Protein accession	YP_001745802
Protein GI	170682606
COG category	[C] Energy production and conversion
COG ID	[COG1301] Na+/H+-dicarboxylate symporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.275466
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCT CTCTGTTTAA AAGCCTTTAC TTTCAGGTCC TGACAGCGAT AGCCATTGGT 
ATTCTCCTTG GCCATTTCTA TCCTGAAATA GGCGAGCAAA TGAAACCGCT TGGCGACGGG 
TTCGTTAAGC TCATTAAGAT GATCATCGCT CCTGTCATCT TTTGTACCGT CGTAACGGGC 
ATTGCGGGCA TGGAAAGCAT GAAGGCGGTC GGTCGTACCG GCGCAGTCGC ACTGCTTTAC 
TTTGAAATTG TCAGTACCAT CGCGCTGATT ATTGGTCTTA TCATCGTTAA CGTCGTGCAG 
CCTGGTGCCG GAATGAACGT CGATCCGGCA ACGCTTGATG CGAAAGCGGT AGCGGTTTAC 
GCCGATCAGG CGAAAGACCA GGGCATTGTC GCCTTCATTA TGGATGTCAT CCCGGCGAGC 
GTCATTGGCG CATTTGCCAG CGGTAACATT CTGCAGGTGC TGCTGTTTGC CGTACTGTTT 
GGTTTTGCGC TCCACCGTCT GGGCAGCAAA GGCCAACTGA TTTTTAACGT GATCGAAAGT 
TTCTCGCAGG TCATCTTCGG CATCATCAAT ATGATCATGC GTCTGGCACC TATTGGTGCG 
TTCGGGGCAA TGGCGTTTAC CATCGGTAAA TACGGCGTCG GCACACTGGT GCAGCTGGGG 
CAGCTGATTA TCTGTTTCTA CATTACCTGT ATCCTGTTTG TGGTGCTGGT ATTGGGTTCA 
ATCGCTAAAG CGACTGGTTT CAGTATCTTC AAATTTATCC GCTACATCCG TGAAGAACTG 
CTGATTGTAC TGGGGACTTC ATCTTCCGAG TCGGCGCTGC CGCGTATGCT CGACAAGATG 
GAGAAACTCG GCTGCCGCAA ATCGGTGGTG GGGCTGGTCA TCCCGACAGG CTACTCGTTT 
AACCTTGATG GCACATCGAT ATACCTGACA ATGGCGGCAG TGTTTATCGC CCAGGCCACT 
AACAGTCAGA TGGATATCGT CCACCAAATC ACGCTGTTAA TCGTGTTGCT GCTTTCTTCT 
AAAGGGGCGG CAGGGGTAAC GGGTAGTGGC TTTATCGTGC TGGCGGCGAC GCTCTCTGCG 
GTGGGCCATT TGCCGGTAGC GGGTCTGGCG CTGATCCTCG GTATCGACCG CTTTATGTCA 
GAAGCTCGTG CGCTGACTAA CCTGGTCGGT AACGGCGTAG CGACCATTGT CGTTGCTAAG 
TGGGTGAAAG AACTGGACCA CAAAAAACTG GACGATGTGC TGAATAATCG TGCGCCGGAT 
GGCAAAACGC ACGAATTATC CTCTTAA

Protein sequence

MKTSLFKSLY FQVLTAIAIG ILLGHFYPEI GEQMKPLGDG FVKLIKMIIA PVIFCTVVTG 
IAGMESMKAV GRTGAVALLY FEIVSTIALI IGLIIVNVVQ PGAGMNVDPA TLDAKAVAVY 
ADQAKDQGIV AFIMDVIPAS VIGAFASGNI LQVLLFAVLF GFALHRLGSK GQLIFNVIES 
FSQVIFGIIN MIMRLAPIGA FGAMAFTIGK YGVGTLVQLG QLIICFYITC ILFVVLVLGS 
IAKATGFSIF KFIRYIREEL LIVLGTSSSE SALPRMLDKM EKLGCRKSVV GLVIPTGYSF 
NLDGTSIYLT MAAVFIAQAT NSQMDIVHQI TLLIVLLLSS KGAAGVTGSG FIVLAATLSA 
VGHLPVAGLA LILGIDRFMS EARALTNLVG NGVATIVVAK WVKELDHKKL DDVLNNRAPD 
GKTHELSS