Gene EcSMS35_1114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1114
Symbol
ID	6145118
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1128517
End bp	1129878
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	48%
IMG OID	641615994
Product	anaerobic C4-dicarboxylate transporter
Protein accession	YP_001743186
Protein GI	170679599
COG category	[C] Energy production and conversion
COG ID	[COG3069] C4-dicarboxylate transporter
TIGRFAM ID	[TIGR00771] c4-dicarboxylate anaerobic carrier family protein

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAAAG TTGTTATCGC GCTTCTTGTT ATCGTGATAG TTGCTCGCTT AATCCTGAAA 
GGATATCGTG CAGAACCCGT GCTTTTTATT GCCGGGCTTG CGCTGATGGT TTGTACCTGG 
TTTACCGGTT GGGGCACAGT GTTACCGAAG GGCGTGTCCG GTACAGGAAT TAGTTTTCTT 
GATCCTTTCG AAGTCATGCG CAATTTATTC AGTACCCGTG CGGCTGATCT CGGTCTGATG 
ATTATGACCC TGATGGGATT TGCGCATTAC ATGGACCATA TCGGTGCGAA TGAAGCGGTT 
GTCCGTGTGG TAACCCGGCC ATTACGGACA TTACGTTCCC CCTATGTTCT GCTTTTTTTC 
TCTTATCTTT TCGCCAGTCT TCTTCAACTG GCTATCCCCT CAGCTACCGG ACTTGCTGTT 
TTACTGATGG GAACCATGTT TCCTATTATG CTCGGACTCG GGCTGTCAGC AGCGTCTGCC 
GCAGGGGTAA TTGCCACCTC TCTTGGTGTG GCGTACACAC CGACAGCCAT TGACGCCATA 
CGAGGCTCTG AAGCGGTAAA TATGGATGTG GTGGAGTATG TTGTCTATCA TCAGGGGCCT 
GCTGCTCTGG CGACTGTTCT GATTGTCGGT ATCAGCCACT TTTTCTGGCA GAAACACTGT 
GATCGTAAAG CTGGAACATT ACCTCATGAA ATTGGTACGA CAACGGTCAT AAAAGCAGGC 
AGTACGCCGG CTTATTATGC TCTGCTACCT ATGCTACCGA TCCTGATGGC CGTTGGCTCA 
TCGGAGATTT TTGTCACCGG AATTAATCTC AATATCATTA CGATTGTTCT TATCTCAATG 
GCAATTTGCA TGCTGATCGA ATGGGTCCGT AAATGTGATC TGAAAGCTGT ATGTGACGGG 
TTTACCCATT TCCTGAAAGG AATGGGGACA GCATTTACCG GCGTGGTGGG CTTACTGGTG 
GCCGCAGGTG TGTTTGCTCA TGGGATTAAA AGCATTGGCG CGATAGATCA ATTAATTTTG 
ATGGCAGAGC ACGTTGGGTT ACCCCCTTTT GCGATGGGCA TCGTTTTTGC TCTGGTTACA 
CTGGCTGCAG CTGTCATTAT GGGATCGGGC AATGCGCCAT TTCTGGCTTT TGTTGAACTG 
ATACCACAAA TCGCTGCCAG CATGGGCGTG AATGCCATAT CGATGATCCT GCCTATGCAG 
CAGGCTTCCC ATATGGGGCG TGCGATGTCT CCCGTATCTG GCGTGGTTAT AGCGGTTTCC 
AGTGGAGCAA ATATAACTCC CTTCGAAGTG GTAAAACGCA CTGCTTTACC CCTGATAGTT 
GGTTTTGTTT TTCACTCTGC GATTATCGGT ATTTTTTATT AA

Protein sequence

MIKVVIALLV IVIVARLILK GYRAEPVLFI AGLALMVCTW FTGWGTVLPK GVSGTGISFL 
DPFEVMRNLF STRAADLGLM IMTLMGFAHY MDHIGANEAV VRVVTRPLRT LRSPYVLLFF 
SYLFASLLQL AIPSATGLAV LLMGTMFPIM LGLGLSAASA AGVIATSLGV AYTPTAIDAI 
RGSEAVNMDV VEYVVYHQGP AALATVLIVG ISHFFWQKHC DRKAGTLPHE IGTTTVIKAG 
STPAYYALLP MLPILMAVGS SEIFVTGINL NIITIVLISM AICMLIEWVR KCDLKAVCDG 
FTHFLKGMGT AFTGVVGLLV AAGVFAHGIK SIGAIDQLIL MAEHVGLPPF AMGIVFALVT 
LAAAVIMGSG NAPFLAFVEL IPQIAASMGV NAISMILPMQ QASHMGRAMS PVSGVVIAVS 
SGANITPFEV VKRTALPLIV GFVFHSAIIG IFY