Gene EcolC_2599 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2599
Symbol
ID	6064659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2850659
End bp	2851831
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	51%
IMG OID	641602006
Product	trimethylamine-N-oxide reductase c-type cytochrome TorC
Protein accession	YP_001725557
Protein GI	170020603
COG category	[C] Energy production and conversion
COG ID	[COG3005] Nitrate/TMAO reductases, membrane-bound tetraheme cytochrome c subunit
TIGRFAM ID	[TIGR02162] trimethylamine-N-oxide reductase c-type cytochrome TorC

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.426905
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGAAAC TCTGGAACGC GCTACGCCGA CCCAGTGCTC GTTGGTCGGT ACTGGCGCTG 
GTCGCAATTG GGATTGTGAT TGGCATTGCG CTGATTGTAT TGCCACACGT TGGGATCAAA 
GTCACCAGCA CAACCGAATT TTGTGTCAGT TGCCACAGTA TGCAACCGGT GTATGAAGAA 
TATAAACAGT CGGTGCATTT CCAGAACGCC TCCGGCGTGC GAGCTGAATG CCATGACTGT 
CATATCCCGC CGGATATTCC AGGCATGGTG AAGCGCAAAC TGGAAGCGAG CAATGATATC 
TACCAGACCT TTATTGCTCA CTCCATTGAT ACACCTGAAA AATTCGAAGC CAAACGCGCG 
GAACTTGCCG AGCGTGAATG GGCGCGAATG AAAGAAAACA ACTCGGCAAC CTGCCGCTCC 
TGCCATAACT ACGATGCGAT GGATCATGCG AAGCAGCATC CTGAAGCAGC ACGTCAGATG 
AAGGTGGCAG CGAAAGATAA TCAATCCTGC ATCGACTGTC ATAAAGGTAT TGCCCACCAG 
TTACCGGATA TGAGTAGCGG CTTCCGTAAG CAGTTCGATG AGCTGCGCGC CAGTGCTAAT 
GACAGTGGTG ACACGCTGTA CTCTATTGAT ATTAAGCCAA TTTATGCGGC GAAAGGCGAT 
AAAGAAGCCT CTGGTTCTCT GCTGCCTGCT TCGGAAGTGA AAGTCCTTAA ACGTGACGGC 
GACTGGCTGC AAATTGAAAT TACCGGCTGG ACGGAAAGCG CCGGACGTCA GCGTGTACTC 
ACCCAATTCC CAGGTAAACG CATCTTTGTT GCCTCGATTC GTGGTGATGT GCAGCAGCAG 
GTAAAAACGC TGGAGAAAAC CACCGTTGCC GACACCAATA CCGAGTGGAG CAAGTTGCAG 
GCCACTGCGT GGATGAAGAA AGGCGACATG GTGAACGATA TCAAACCGAT CTGGGCTTAT 
GCGGATTCGT TGTACAACGG CACCTGTAAC CAGTGCCACG GCGCACCGGA AATCGCCCAC 
TTTGACGCTA ACGGTTGGAT CGGCACGCTC AACGGCATGA TTGGCTTTAC CAGTCTCGAT 
AAACGTGAAG AACGCACCTT GTTGAAATAT CTGCAAATGA ATGCGTCTGA CACCGCAGGT 
AAGGCTCACG GCGATAAGAA GGAAGAAAAA TAA

Protein sequence

MRKLWNALRR PSARWSVLAL VAIGIVIGIA LIVLPHVGIK VTSTTEFCVS CHSMQPVYEE 
YKQSVHFQNA SGVRAECHDC HIPPDIPGMV KRKLEASNDI YQTFIAHSID TPEKFEAKRA 
ELAEREWARM KENNSATCRS CHNYDAMDHA KQHPEAARQM KVAAKDNQSC IDCHKGIAHQ 
LPDMSSGFRK QFDELRASAN DSGDTLYSID IKPIYAAKGD KEASGSLLPA SEVKVLKRDG 
DWLQIEITGW TESAGRQRVL TQFPGKRIFV ASIRGDVQQQ VKTLEKTTVA DTNTEWSKLQ 
ATAWMKKGDM VNDIKPIWAY ADSLYNGTCN QCHGAPEIAH FDANGWIGTL NGMIGFTSLD 
KREERTLLKY LQMNASDTAG KAHGDKKEEK