Gene EcSMS35_2129 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2129
Symbol	torT
ID	6146354
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2139341
End bp	2140369
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	54%
IMG OID	641617006
Product	TMAO reductase system periplasmic protein TorT
Protein accession	YP_001744181
Protein GI	170680014
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR02955] TMAO reductase system periplasmic protein TorT

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCAC TGCTATTGTT ACTTCTTTCC CTTTTCATGT TATCGGCATT TTCGGCTGAT 
AACCTGTTGC GCTGGCATGA TGCGCAGCAT TTCTCGGTGC AAGCCTCTAT GCCGCTTAAA 
GCCAAACGCG CATGGAAACT GTGCGCGCTT TATCCCAGCC TGAAAGATTC ATACTGGTTA 
TCGTTGAACT ATGGTATGCA GGAGGCTGCT CGCCGCTACG GTGTGGATTT AAAAGTGCTG 
GAGGCAGGCG GCTACAGCCA GTTGGCTACC CAGCAAGCAC AAATCGACCA GTGTAAACAG 
TGGGGCGCAG AGGCCATCTT GCTCGGAAGT AGCACGACGT CATTTCCCGA CCTGCAAAAG 
CAGGTAGCAA ATCTGCCGGT GATCGAACTG GTGAATGCTA TTGATGCTCC CCACGTGAAA 
AGCCGCGTTG GTGTGCCCTG GTTTCAGATG GGCTATCAAC CAGGACGATA TCTGGTGCAA 
TGGAGCCACG GTAAACCACT GAACGTGCTG TTGATGCCCG GCCCCGATAA CGCCGGGGGC 
AGTAAGGAGA TGGTAGAGGG TTTTCGCGCA GCCATTGCCG GAAGTCCGGT ACGTATTGTT 
GATATTGCGC TCGGTGATAA CGATATTGAA ATCCAGCGTA ACCTGTTGCA GGAGATGCTG 
GAGCGCCATC CAGAAATCGA CGTCGTTGCC GGAACGGCCA TTGCGGCAGA GGCGGCAATG 
GGGGAAGGGC GTAACCTGAA AACACCGCTT ACCGTGGTGT CGTTTTATCT TTCACATCAG 
GTGTATCGCG GGCTGAAGCG GGGAAGAGTG ATTATGGCTG CCAGCGATCA AATGGTCTGG 
CAGGGGGAAC TGGCGGTTGA GCAGGCCATC AGGCAATTAC AGGGGCAATC GGTGTCTGAT 
AATGTCAGCC CACCGATTTT AGTTCTGACG CCGAAAAATG CCGACCGCGA ACATATCCGC 
CGCTCGCTGT CACCGGGGGG ATTTCGTCCG GTCTATTATT ATCAGCACAC ATCAGCGGCT 
AAGAAATAA

Protein sequence

MRALLLLLLS LFMLSAFSAD NLLRWHDAQH FSVQASMPLK AKRAWKLCAL YPSLKDSYWL 
SLNYGMQEAA RRYGVDLKVL EAGGYSQLAT QQAQIDQCKQ WGAEAILLGS STTSFPDLQK 
QVANLPVIEL VNAIDAPHVK SRVGVPWFQM GYQPGRYLVQ WSHGKPLNVL LMPGPDNAGG 
SKEMVEGFRA AIAGSPVRIV DIALGDNDIE IQRNLLQEML ERHPEIDVVA GTAIAAEAAM 
GEGRNLKTPL TVVSFYLSHQ VYRGLKRGRV IMAASDQMVW QGELAVEQAI RQLQGQSVSD 
NVSPPILVLT PKNADREHIR RSLSPGGFRP VYYYQHTSAA KK