Gene EcHS_A1105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1105
Symbol	torT
ID	5592687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1117097
End bp	1118125
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	54%
IMG OID	640920268
Product	TMAO reductase system periplasmic protein TorT
Protein accession	YP_001457832
Protein GI	157160514
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR02955] TMAO reductase system periplasmic protein TorT

Plasmid Coverage information

Num covering plasmid clones	74
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGTAC TGCTATTTTT ACTTCTTTCC CTTTTCATGT TGCCGGCATT TTCGGCTGAT 
AACCTGTTGC GCTGGCATGA TGCGCAGCAT TTCACGGTGC AAGCCTCTAC GCCGCTTAAA 
GCCAAACGCG CATGGAAACT GTGCGCGCTT TATCCCAGCC TGAAAGATTC ATATTGGTTA 
TCGTTGAACT ATGGTATGCA GGAGGCTGCT CGCCGCTACG GTGTGGATTT AAAAGTGCTG 
GAGGCAGGCG GCTACAGCCA GTTGGCTACC CAGCAAGCAC AAATCGACCA GTGTAAACAG 
TGGGGCGCAG AGGCCATTTT GCTCGGTAGT AGCACGACCT CATTTCCCGA CCTGCAAAAG 
CAGGTAGCAA GTCTGCCGGT GATCGAACTG GTAAATGCTA TTGATGCTCC CCAGGTGAAA 
AGCCGCGTTG GTGTGCCCTG GTTTCAGATG GGCTATCAAC CGGGGCGATA TCTGGTGCAA 
TGGGCGCACG GTAAACCACT GAATGTGCTG TTGATGCCCG GACCCGATAA CGCCGGGGGC 
AGTAAGGAGA TGGTCGAGGG TTTTCGCGCA GCCATTGCCG GAAGCCCGGT GCGTATTGTT 
GATATTGCGC TTGGTGATAA CGATATTGAA ATCCAGCGTA ACCTGTTGCA GGAGATGCTG 
GAACGCCATC CAGAAATCGA CGTCGTTGCC GGAACGGCCA TTGCGGCAGA GGCGGCAATG 
GGGGAAGGGC GTAACCTGAA AACGCCGCTT ACCGTGGTGT CGTTTTATCT TTCACATCAG 
GTGTATCGCG GGCTGAAGCG GGGAAGAGTG ATTATGGCTG CCAGCGATCA AATGGTCTGG 
CAGGGGGAAC TGGCGGTTGA GCAGGCCATC AGGCAATTAC AGGGGCAATC GGTGTCTGAT 
AATGTCAGCC CACCGATTTT AGTTCTGACG CCGAAAAATG CCGACCGTGA ACATATTCGC 
CGCTCGCTGT CACCAGGGGG ATTTCGTCCG GTCTATTTTT ATCAGCACAC ATCAGCGGCT 
AAGAAATAA

Protein sequence

MRVLLFLLLS LFMLPAFSAD NLLRWHDAQH FTVQASTPLK AKRAWKLCAL YPSLKDSYWL 
SLNYGMQEAA RRYGVDLKVL EAGGYSQLAT QQAQIDQCKQ WGAEAILLGS STTSFPDLQK 
QVASLPVIEL VNAIDAPQVK SRVGVPWFQM GYQPGRYLVQ WAHGKPLNVL LMPGPDNAGG 
SKEMVEGFRA AIAGSPVRIV DIALGDNDIE IQRNLLQEML ERHPEIDVVA GTAIAAEAAM 
GEGRNLKTPL TVVSFYLSHQ VYRGLKRGRV IMAASDQMVW QGELAVEQAI RQLQGQSVSD 
NVSPPILVLT PKNADREHIR RSLSPGGFRP VYFYQHTSAA KK