Gene SeSA_A4034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4034
Symbol	torC
ID	6519262
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	3905143
End bp	3906327
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	53%
IMG OID	642749004
Product	trimethylamine-N-oxide reductase c-type cytochrome TorC
Protein accession	YP_002116766
Protein GI	194737058
COG category	[C] Energy production and conversion
COG ID	[COG3005] Nitrate/TMAO reductases, membrane-bound tetraheme cytochrome c subunit
TIGRFAM ID	[TIGR02162] trimethylamine-N-oxide reductase c-type cytochrome TorC

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAAAAC TCTGGAGAGC GCTACTCAGG CCAAGCGCCC GTTGGTCGAT ACTGGCGCTG 
GTCATTGTCG GGATTGTGAT CGGCGTTGCG CTGATCGTGT TACCTCACGT CGGTATCAAA 
CTGACCAGTA CGACAGAGTT TTGCGTCAGC TGCCATAGTA TGCAGCCGGT GTATCAGGAA 
TATAAACAGT CCGTACATTT CCAGAACGCT TCCGGCGTAC GCGCGGAATG TCACGATTGC 
CATATCCCCC CTGATATTCC AGGCATGGTG AAACGTAAGC TGGAAGCCAG CAACGATCTT 
TACCAGACAT TTATCGCCCA CTCGATTGAT ACCCCGGAAA AATTTGAAGC CAAACGTGCC 
GAGCTTGCCG AGCGTGAATG GGCGCGCATG AAAGAGAATA ACTCCGCGAC CTGTCGTTCC 
TGCCATAACT ACGATGCGAT GGATCACGCG AAACAGAACC CGGAAGCGGC GCGGCAAATG 
AAAATCGCCG CGAAAGAAAA TCAGTCCTGC ATCGACTGCC ATAAAGGGAT TGCCCACCAG 
CTACCGGATA TGAGCAGCGG TTTCCGCAAA CAGTTTGATG AACTGCGCGC CAGCGCCAGT 
ACGCATAATG ACGGCGATAC GCTCTATTCG CTGGATATCA AGCCGATTTA CGCCGCTAAA 
GGCGATAAAG AACCGGCAGG TTCGTTGTTA CCTGCTTCTG AAGTGAAAGT CCTTAAACGG 
GACGGTGACT GGCTGCAAGT GCAAATCGAA GGCTGGACGG AGACGGACGG TCGTCAGCGC 
GTGCTGACGC AGTTGCCCGG TAAACGTATT TTTGTCGCTT CGATTCGCGG CGATGTGCAA 
CAGCATGTGA AAACGCTGGA AGAGACCACC GTCGCGGCGA CCAATACTCA GTGGAGCAAA 
TTACAGGCAA CCGCGTGGAT GCAAAAAGGC GACATGGTAA ATGACATTAA ACCGATTTGG 
GCCTATGCCG ACTCCCTCTA TAACGGCACC TGTAATCAGT GTCACGGCGC GCCGGACAAA 
GCGCACTTTG ACGCTAACGG CTGGATCGGC ACGCTCAACG GCATGATCGG TTTCACCAGT 
CTGGATAAGC GTGAAGAACG TACCTTGTTG AAATATCTCC AGATGAATGC GTCTGATACC 
ACCAATACGC CGCACAGCGA TAAGGGAGAA CACAATGAAA AATAA

Protein sequence

MRKLWRALLR PSARWSILAL VIVGIVIGVA LIVLPHVGIK LTSTTEFCVS CHSMQPVYQE 
YKQSVHFQNA SGVRAECHDC HIPPDIPGMV KRKLEASNDL YQTFIAHSID TPEKFEAKRA 
ELAEREWARM KENNSATCRS CHNYDAMDHA KQNPEAARQM KIAAKENQSC IDCHKGIAHQ 
LPDMSSGFRK QFDELRASAS THNDGDTLYS LDIKPIYAAK GDKEPAGSLL PASEVKVLKR 
DGDWLQVQIE GWTETDGRQR VLTQLPGKRI FVASIRGDVQ QHVKTLEETT VAATNTQWSK 
LQATAWMQKG DMVNDIKPIW AYADSLYNGT CNQCHGAPDK AHFDANGWIG TLNGMIGFTS 
LDKREERTLL KYLQMNASDT TNTPHSDKGE HNEK