Gene ECH74115_1232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1232
Symbol	torC
ID	6967160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1241470
End bp	1242642
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	51%
IMG OID	643385227
Product	cytochrome c-type protein torC
Protein accession	YP_002269722
Protein GI	209400451
COG category	[C] Energy production and conversion
COG ID	[COG3005] Nitrate/TMAO reductases, membrane-bound tetraheme cytochrome c subunit
TIGRFAM ID	[TIGR02162] trimethylamine-N-oxide reductase c-type cytochrome TorC

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGAAAC TCTGGAACGC GCTACGCCGA CCCAGTGCTC GTTGGTCGGT ACTGGCGCTG 
GTCGCTATTG GGATTGTGAT TGGCATTGCG CTGATTGTAT TGCCACACGT TGGGATCAAA 
GTCACCAGCA CAACCGAATT TTGTGTCAGT TGCCACAGTA TGCAACCAGT GTATGAAGAA 
TATAAACAGT CGGTGCATTT CCAGAACGCC TCCGGCGTGC GAGCTGAATG CCATGACTGT 
CATATCCCGC CGGATATTCC AGGCATGGTG AAGCGCAAAC TGGAAGCGAG CAACGATATC 
TACCAGACCT TTATTGCCCA CTCCATTGAT ACACCTGAAA AATTTGAAGC CAAACGCGCG 
GAACTTGCCG AGCGTGAATG GGCGCGAATG AAAGAAAACA ACTCGGCAAC CTGTCGCTCC 
TGCCATAACT ACGATGCGAT GGATCATGCG AAGCAGCATC CTGAAGCGGC ACGTCAGATG 
AAGGTGGCAG CGAAAGATAA TCAATCCTGC ATCGACTGTC ATAAAGGTAT TGCCCACCAG 
TTACCGGATA TGAGTAGCGG CTTCCGTAAG CAGTTCGATG AGCTGCGCGC CGGTGCTAAT 
GACAGTGGTG ACACGCTGTA CTCTATTGAT ATTAAGCCAA TTTATGCGGC GAAAGGCGAT 
AAAGAAGCCT CTGGTTCTCT GCTGCCTGCC TCGGAAGTGA AAGTCCTTAA ACGTGACGGC 
GACTGGCTGC AAATTGAAAT TACCGGCTGG ACAGAAAGCG CCGGACGTCA GCGTGTACTC 
ACCCAATTCC CAGGTAAACG CATCTTTGTT GCCTCGATTC GTGGTGATGT GCAGCAGCAG 
GTAAAAACGC TGGAGAAAAC CACCGTTGCC GACACCAATA CCGAGTGGAG CAAGTTGCAG 
GCCACCGCGT GGATGAAGAA AGGTGACATG GTGAACGATA TCAAACCGAT CTGGGCTTAT 
GCGGATTCGT TGTACAACGG CACCTGTAAC CAGTGCCACG GCGCACCGGA AATCTCTCAC 
TTTGACGCTA ACGGCTGGAT TGGCACGCTC AACGGCATGA TCGGCTTTAC CAGCCTCGAT 
AAACGTGAAG AACGCACCTT GTTGAAATAT CTGCAAATGA ATGCGTCTGA CACCGCAGGT 
AAGGCTCACG GCGATAAGAA GGAAGAAAAA TAA

Protein sequence

MRKLWNALRR PSARWSVLAL VAIGIVIGIA LIVLPHVGIK VTSTTEFCVS CHSMQPVYEE 
YKQSVHFQNA SGVRAECHDC HIPPDIPGMV KRKLEASNDI YQTFIAHSID TPEKFEAKRA 
ELAEREWARM KENNSATCRS CHNYDAMDHA KQHPEAARQM KVAAKDNQSC IDCHKGIAHQ 
LPDMSSGFRK QFDELRAGAN DSGDTLYSID IKPIYAAKGD KEASGSLLPA SEVKVLKRDG 
DWLQIEITGW TESAGRQRVL TQFPGKRIFV ASIRGDVQQQ VKTLEKTTVA DTNTEWSKLQ 
ATAWMKKGDM VNDIKPIWAY ADSLYNGTCN QCHGAPEISH FDANGWIGTL NGMIGFTSLD 
KREERTLLKY LQMNASDTAG KAHGDKKEEK