Gene EcSMS35_0640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0640
Symbol	dcuC
ID	6144126
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	653982
End bp	655367
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	51%
IMG OID	641615532
Product	C4-dicarboxylate transporter DcuC
Protein accession	YP_001742738
Protein GI	170680591
COG category	[C] Energy production and conversion
COG ID	[COG3069] C4-dicarboxylate transporter
TIGRFAM ID	[TIGR00771] c4-dicarboxylate anaerobic carrier family protein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.907894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGACAT TCATTGAACT CCTTATTGGG GTTGTGGTTA TTGTGGGTGT AGCTCGCTAC 
ATCATTAAAG GGTATTCCGC CACTGGCGTG TTATTTGTCG GTGGCCTGTT ATTGCTGATT 
ATCAGTGCCA TTATGGGGCA CAAAGTGTTA CCGTCCAGCC AGGCTTCAAC AGGCTACAGC 
GCCACGGATA TCGTTGAATA CGTTAAAATA TTGCTAATGA GCCGCGGCGG CGACCTCGGC 
ATGATGATTA TGATGCTGTG TGGCTTTGCC GCTTACATGA CCCATATCGG CGCGAATGAT 
ATGGTGGTCA AGCTGGCGTC AAAACCATTG CAGTATATTA ACTCCCCTTA CCTGCTGATG 
ATTGCCGCCT ATTTTGTCGC CTGTCTGATG TCTCTGGCCG TCTCTTCCGC AACCGGTCTG 
GGTGTTTTGC TGATGGCAAC CCTGTTTCCG GTGATGGTAA ACGTTGGTAT CAGCCGTGGT 
GCAGCTGCTG CTATTTGTGC CTCCCCGGCG GCGATTATTC TCGCACCGAC TTCAGGGGAT 
GTGGTGCTGG CGGCGCAGGC TTCCGAAATG TCGCTGATTG ACTTCGCCTT CAAAACGACG 
CTGCCTATCT CAATTGCTGC AATTATCGGC ATGGCGATCG CCCACTTCTT CTGGCAACGT 
TATCTGGATA AAAAAGAGCA CATCTCTCAT GAAATGTTAG ATGTCAGTGA AATCACCACT 
ACTGCTCCTG CGTTTTATGC CATTTTGCCG TTCACGCCGA TCATCGGAGT GCTGATTTTT 
GACGGCAAAT GGGGTCCGCA ATTACACATC ATCACTATTC TGGTGATTTG TATGCTGATT 
GCCTCCATTC TGGAGTTCAT CCGCAGCTTT AATACCCAGA AAGTTTTCTC TGGTCTGGAA 
GTGGCTTATC GCGGGATGGC CGATGCGTTT GCTAACGTGG TGATGCTGCT GGTTGCCGCT 
GGGGTATTCG CTCAGGGGCT TAGCACCATC GGCTTTATTC AAAGTCTGAT TTCTATCGCC 
ACCTCGTTTG GTTCGGCGAG TATCATCCTG ATGCTGGTAT TAGTGATCCT GACAATGCTG 
GCGGCAGTCA CGACCGGTTC AGGCAATGCG CCGTTTTATG CGTTTGTTGA GATGATCCCG 
AAACTGGCGC ACTCTTCCGG CATTAACCCG GCGTATTTGA CTATCCCAAT GCTGCAGGCG 
TCAAACCTCG GCCGTACCCT GTCACCCGTT TCTGGCGTAG TCGTTGCGGT TGCCGGGATG 
GCGAAAATCT CACCATTTGA AGTCGTAAAA CGCACCTCGG TGCCGGTGCT TGTTGGGCTG 
GTGATTGTTA TCGTTGCTAC AGAGCTGATG GTGCCAGGAA CGGCAGCCGC GGTCACAGGC 
AAGTAA

Protein sequence

MLTFIELLIG VVVIVGVARY IIKGYSATGV LFVGGLLLLI ISAIMGHKVL PSSQASTGYS 
ATDIVEYVKI LLMSRGGDLG MMIMMLCGFA AYMTHIGAND MVVKLASKPL QYINSPYLLM 
IAAYFVACLM SLAVSSATGL GVLLMATLFP VMVNVGISRG AAAAICASPA AIILAPTSGD 
VVLAAQASEM SLIDFAFKTT LPISIAAIIG MAIAHFFWQR YLDKKEHISH EMLDVSEITT 
TAPAFYAILP FTPIIGVLIF DGKWGPQLHI ITILVICMLI ASILEFIRSF NTQKVFSGLE 
VAYRGMADAF ANVVMLLVAA GVFAQGLSTI GFIQSLISIA TSFGSASIIL MLVLVILTML 
AAVTTGSGNA PFYAFVEMIP KLAHSSGINP AYLTIPMLQA SNLGRTLSPV SGVVVAVAGM 
AKISPFEVVK RTSVPVLVGL VIVIVATELM VPGTAAAVTG K