Gene EcolC_2601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2601
Symbol
ID	6066895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2852626
End bp	2853654
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	54%
IMG OID	641602008
Product	TMAO reductase system periplasmic protein TorT
Protein accession	YP_001725559
Protein GI	170020605
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR02955] TMAO reductase system periplasmic protein TorT

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.429826
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTAC TGCTATTTTT ACTTCTTTCC CTTTTCATGT TGCCGGCATT TTCGGCTGAT 
AACCTGTTGC GCTGGCATGA TGCGCAGCAT TTCACGGTGC AAGCCTCTAC GCCGCTTAAA 
GCCAAACGCG CATGGAAACT GTGCGCGCTT TATCCCAGCC TGAAAGATTC ATATTGGTTA 
TCGTTGAACT ATGGTATGCA GGAGGCTGCT CGCCGCTACG GTGTGGATTT AAAAGTGCTG 
GAGGCAGGCG GCTACAGCCA GTTGGCTACC CAGCAAGCAC AAATCGACCA GTGTAAACAG 
TGGGGCGCAG AGGCCATTTT GCTCGGTAGT AGCACGACCT CATTTCCCGA CCTGCAAAAG 
CAGGTAGCAA GTCTGCCGGT GATCGAACTG GTAAATGCTA TTGATGCTCC CCAGGTGAAA 
AGCCGCGTTG GTGTGCCCTG GTTTCAGATG GGCTATCAAC CGGGGCGATA TCTGGTGCAA 
TGGGCGCACG GTAAACCACT GAATGTGCTG TTGATGCCCG GACCCGATAA CGCCGGGGGC 
AGTAAGGAGA TGGTCGAGGG TTTTCGCGCA GCCATTGCCG GAAGCCCGGT GCGTATTGTT 
GATATTGCGC TTGGTGATAA CGATATTGAA ATCCAGCGTA ACCTGTTGCA GGAGATGCTG 
GAACGCCATC CAGAAATCGA CGTCGTTGCC GGAACGGCCA TTGCGGCAGA GGCGGCAATG 
GGGGAAGGGC GTAACCTGAA AACGCCGCTT ACCGTGGTGT CGTTTTATCT TTCACATCAG 
GTGTATCGCG GGCTGAAGCG GGGAAGAGTG ATTATGGCTG CCAGCGATCA AATGGTCTGG 
CAGGGGGAAC TGGCGGTTGA GCAGGCCATC AGGCAATTAC AGGGGCAATC GGTGTCTGAT 
AATGTCAGCC CACCGATTTT AGTTCTGACG CCGAAAAATG CCGACCGTGA ACATATTCGC 
CGCTCGCTGT CACCAGGGGG ATTTCGTCCG GTCTATTTTT ATCAGCACAC ATCAGCGGCT 
AAGAAATAA

Protein sequence

MRVLLFLLLS LFMLPAFSAD NLLRWHDAQH FTVQASTPLK AKRAWKLCAL YPSLKDSYWL 
SLNYGMQEAA RRYGVDLKVL EAGGYSQLAT QQAQIDQCKQ WGAEAILLGS STTSFPDLQK 
QVASLPVIEL VNAIDAPQVK SRVGVPWFQM GYQPGRYLVQ WAHGKPLNVL LMPGPDNAGG 
SKEMVEGFRA AIAGSPVRIV DIALGDNDIE IQRNLLQEML ERHPEIDVVA GTAIAAEAAM 
GEGRNLKTPL TVVSFYLSHQ VYRGLKRGRV IMAASDQMVW QGELAVEQAI RQLQGQSVSD 
NVSPPILVLT PKNADREHIR RSLSPGGFRP VYFYQHTSAA KK