Gene EcolC_3874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3874
Symbol
ID	6064614
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4230301
End bp	4231602
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	53%
IMG OID	641603289
Product	anaerobic C4-dicarboxylate transporter
Protein accession	YP_001726805
Protein GI	170021851
COG category	[R] General function prediction only
COG ID	[COG2704] Anaerobic C4-dicarboxylate transporter
TIGRFAM ID	[TIGR00770] anaerobic c4-dicarboxylate membrane transporter family protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTAGTTG TAGAACTCAT CATAGTTTTG CTGGCGATCT TCTTGGGCGC CAGATTGGGG 
GGAATAGGTA TTGGTTTTGC AGGCGGATTG GGGGTGCTGG TTCTTGCCGC TATTGGCGTT 
AAACCCGGTA ACATCCCGTT CGATGTCATC TCCATTATCA TGGCGGTTAT CGCCGCTATT 
TCTGCCATGC AGGTTGCTGG CGGTCTGGAC TATCTGGTTC ATCAGACAGA AAAGCTGCTG 
CGCCGTAACC CGAAATACAT CACGATCCTC GCACCGATCG TGACCTATTT CCTGACTATC 
TTTGCTGGTA CTGGCAACAT CTCTCTGGCG ACACTGCCAG TTATCGCTGA AGTTGCGAAG 
GAACAAGGCG TTAAACCTTG CCGTCCGCTG TCTACTGCAG TGGTATCCGC GCAGATTGCG 
ATCACCGCAT CGCCAATCTC AGCGGCAGTG GTTTACATGT CTTCCGTGAT GGAAGGTCAT 
GGCATCAGCT ACCTCCATCT GCTCTCCGTG GTCATCCCGT CCACCCTGCT GGCGGTTCTG 
GTGATGTCCT TCCTGGTCAC TATGCTGTTC AACTCCAAAC TCTCTGACGA TCCGATTTAT 
CGCAAGCGTC TGGAAGAGGG CCTGGTTGAA CTGCGCGGTG AAAAGCAGAT TGAAATCAAA 
TCCGGTGCAA AAACGTCCGT CTGGCTGTTC CTGCTGGGCG TAGTTGGCGT GGTTATCTAT 
GCAATCATCA ACAGCCCAAG CATGGGTCTG GTTGAAAAAC CGCTGATGAA CACCACCAAC 
GCAATCCTGA TCATCATGCT CAGCGTTGCA ACTCTGACCA CCGTTATCTG TAAAGTCGAT 
ACCGACAACA TCCTCAACTC CAGCACCTTC AAAGCAGGTA TGAGCGCCTG TATTTGTATC 
CTGGGTGTTG CGTGGCTGGG CGATACTTTC GTTTCCAACA ACATCGACTG GATCAAAGAT 
ACCGCTGGTG AAGTGATTCA GGGTCATCCG TGGCTGCTGG CCGTCATCTT CTTCTTTGCT 
TCTGCTCTGC TGTACTCTCA GGCTGCAACC GCAAAAGCAC TGATGCCGAT GGCTCTGGCA 
CTGAACGTTT CACCGCTGAC CGCTGTTGCT TCTTTCGCTG CGGTGTCTGG TCTGTTCATT 
CTGCCGACCT ACCCGACGCT GGTTGCTGCG GTACAGATGG ATGACACGGG TACTACCCGT 
ATCGGTAAAT TCGTCTTCAA CCATCCGTTC TTCATCCCGG GTACTCTGGG TGTTGCCCTG 
GCCGTTTGCT TCGGCTTCGT GCTGGGTAGC TTCATGCTGT AA

Protein sequence

MLVVELIIVL LAIFLGARLG GIGIGFAGGL GVLVLAAIGV KPGNIPFDVI SIIMAVIAAI 
SAMQVAGGLD YLVHQTEKLL RRNPKYITIL APIVTYFLTI FAGTGNISLA TLPVIAEVAK 
EQGVKPCRPL STAVVSAQIA ITASPISAAV VYMSSVMEGH GISYLHLLSV VIPSTLLAVL 
VMSFLVTMLF NSKLSDDPIY RKRLEEGLVE LRGEKQIEIK SGAKTSVWLF LLGVVGVVIY 
AIINSPSMGL VEKPLMNTTN AILIIMLSVA TLTTVICKVD TDNILNSSTF KAGMSACICI 
LGVAWLGDTF VSNNIDWIKD TAGEVIQGHP WLLAVIFFFA SALLYSQAAT AKALMPMALA 
LNVSPLTAVA SFAAVSGLFI LPTYPTLVAA VQMDDTGTTR IGKFVFNHPF FIPGTLGVAL 
AVCFGFVLGS FML