Gene ECH74115_5654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5654
Symbol	dcuA
ID	6971959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	5295123
End bp	5296424
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	52%
IMG OID	643389288
Product	anaerobic C4-dicarboxylate transporter
Protein accession	YP_002273684
Protein GI	209397673
COG category	[R] General function prediction only
COG ID	[COG2704] Anaerobic C4-dicarboxylate transporter
TIGRFAM ID	[TIGR00770] anaerobic c4-dicarboxylate membrane transporter family protein

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00371648
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.384394
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTAGTTG TAGAACTCAT CATAGTTTTG CTGGCGATCT TCTTGGGCGC CAGATTGGGG 
GGAATAGGTA TTGGTTTTGC AGGCGGATTG GGGGTGCTGG TTCTTGCCGC TATTGGCGTT 
AAACCCGGTA ACATCCCGTT CGATGTCATT TCCATTATCA TGGCGGTTAT CGCCGCTATT 
TCTGCCATGC AGGTTGCTGG CGGTCTGGAC TATCTGGTTC ATCAGACAGA AAAGCTGCTG 
CGCCGTAACC CGAAATACAT CACGATCCTC GCACCGATCG TGACCTATTT CCTGACTATC 
TTTGCTGGTA CTGGCAACAT CTCTCTGGCG ACACTGCCAG TTATCGCTGA AGTTGCGAAG 
GAACAAGGCG TTAAACCTTG CCGTCCGCTG TCTACTGCAG TGGTATCCGC GCAGATTGCG 
ATCACCGCAT CGCCAATCTC AGCGGCAGTG GTTTACATGT CTTCCGTGAT GGAAGGTCAT 
GGCATCAGCT ACCTCCATCT GCTCTCCGTG GTCATCCCGT CCACCCTGCT GGCGGTTCTG 
GTGATGTCCT TCCTGGTCAC TATGCTGTTC AACTCCAAAC TCTCTGACGA TCCGATTTAT 
CGCAAGCGTC TGGAAGAGGG CCTGGTTGAA CTGCGCGGTG AAAAGCAGAT TGAAATCAAA 
TCCGGTGCAA AAACGTCCGT CTGGCTGTTC CTGCTGGGCG TAGTTGGCGT GGTTATCTAT 
GCAATCATCA ACAGCCCAAG CATGGGTCTG GTTGAAAAAC CGCTGATGAA CACCACCAAC 
GCAATCCTGA TCATCATGCT CAGTGTTGCA ACTCTGACCA CCGTTATCTG TAAAGTCGAT 
ACCGACAACA TCCTCAACTC CAGCACCTTC AAAGCAGGTA TGAGCGCCTG TATTTGTATC 
CTGGGTGTTG CGTGGCTGGG CGATACTTTC GTTTCCAACA ACATCGACTG GATCAAAGAT 
ACCGCTGGTG AAGTGATTCA GGGTCATCCG TGGCTGCTGG CCGTCATCTT CTTCTTTGCT 
TCTGCTCTGC TGTACTCTCA GGCTGCAACC GCAAAAGCAC TGATGCCGAT GGCTCTGGCA 
CTGAACGTTT CTCCGCTGAC CGCTGTTGCT TCTTTCGCTG CGGTGTCTGG TCTGTTCATT 
CTGCCGACCT ACCCGACGCT GGTTGCTGCG GTACAGATGG ATGACACGGG TACTACCCGT 
ATCGGTAAAT TCGTCTTCAA CCATCCGTTC TTCATCCCGG GTACTCTGGG TGTTGCCCTG 
GCCGTTTGCT TCGGCTTCGT GCTGGGTAGC TTCATGCTGT AA

Protein sequence

MLVVELIIVL LAIFLGARLG GIGIGFAGGL GVLVLAAIGV KPGNIPFDVI SIIMAVIAAI 
SAMQVAGGLD YLVHQTEKLL RRNPKYITIL APIVTYFLTI FAGTGNISLA TLPVIAEVAK 
EQGVKPCRPL STAVVSAQIA ITASPISAAV VYMSSVMEGH GISYLHLLSV VIPSTLLAVL 
VMSFLVTMLF NSKLSDDPIY RKRLEEGLVE LRGEKQIEIK SGAKTSVWLF LLGVVGVVIY 
AIINSPSMGL VEKPLMNTTN AILIIMLSVA TLTTVICKVD TDNILNSSTF KAGMSACICI 
LGVAWLGDTF VSNNIDWIKD TAGEVIQGHP WLLAVIFFFA SALLYSQAAT AKALMPMALA 
LNVSPLTAVA SFAAVSGLFI LPTYPTLVAA VQMDDTGTTR IGKFVFNHPF FIPGTLGVAL 
AVCFGFVLGS FML