Gene EcDH1_2646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2646
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2821863
End bp	2823035
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	51%
IMG OID
Product	trimethylamine-N-oxide reductase c-type cytochrome TorC
Protein accession	ACX40280
Protein GI	260449858
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGAAAC TCTGGAACGC GCTACGCCGA CCCAGTGCTC GTTGGTCGGT ACTGGCGCTG 
GTCGCAATTG GGATTGTGAT TGGCATTGCG CTGATTGTAT TGCCACACGT TGGGATCAAA 
GTCACCAGCA CAACCGAATT TTGTGTCAGT TGCCACAGTA TGCAACCGGT GTATGAAGAA 
TATAAACAGT CGGTGCATTT CCAGAACGCC TCCGGCGTGC GAGCTGAATG CCATGACTGT 
CATATCCCGC CGGATATTCC AGGCATGGTG AAGCGCAAAC TGGAAGCGAG CAATGATATC 
TACCAGACCT TTATTGCTCA CTCCATTGAT ACACCTGAAA AATTCGAAGC CAAACGCGCG 
GAACTTGCCG AGCGTGAATG GGCGCGAATG AAAGAAAACA ACTCGGCAAC CTGCCGCTCC 
TGCCATAACT ACGATGCGAT GGATCATGCG AAGCAGCATC CTGAAGCAGC ACGTCAGATG 
AAGGTGGCAG CGAAAGATAA TCAATCCTGC ATCGACTGTC ATAAAGGTAT TGCCCACCAG 
TTACCGGATA TGAGTAGCGG CTTCCGTAAG CAGTTCGATG AGCTGCGCGC CAGTGCTAAT 
GACAGTGGTG ACACGCTGTA CTCTATTGAT ATTAAGCCAA TTTATGCGGC GAAAGGCGAT 
AAAGAAGCCT CTGGTTCTCT GCTGCCTGCT TCGGAAGTGA AAGTCCTTAA ACGTGACGGC 
GACTGGCTGC AAATTGAAAT TACCGGCTGG ACGGAAAGCG CCGGACGTCA GCGTGTACTC 
ACCCAATTCC CAGGTAAACG CATCTTTGTT GCCTCGATTC GTGGTGATGT GCAGCAGCAG 
GTAAAAACGC TGGAGAAAAC CACCGTTGCC GACACCAATA CCGAGTGGAG CAAGTTGCAG 
GCCACTGCGT GGATGAAGAA AGGCGACATG GTGAACGATA TCAAACCGAT CTGGGCTTAT 
GCGGATTCGT TGTACAACGG CACCTGTAAC CAGTGCCACG GCGCACCGGA AATCGCCCAC 
TTTGACGCTA ACGGTTGGAT CGGCACGCTC AACGGCATGA TTGGCTTTAC CAGTCTCGAT 
AAACGTGAAG AACGCACCTT GTTGAAATAT CTGCAAATGA ATGCGTCTGA CACCGCAGGT 
AAGGCTCACG GCGATAAGAA GGAAGAAAAA TAA

Protein sequence

MRKLWNALRR PSARWSVLAL VAIGIVIGIA LIVLPHVGIK VTSTTEFCVS CHSMQPVYEE 
YKQSVHFQNA SGVRAECHDC HIPPDIPGMV KRKLEASNDI YQTFIAHSID TPEKFEAKRA 
ELAEREWARM KENNSATCRS CHNYDAMDHA KQHPEAARQM KVAAKDNQSC IDCHKGIAHQ 
LPDMSSGFRK QFDELRASAN DSGDTLYSID IKPIYAAKGD KEASGSLLPA SEVKVLKRDG 
DWLQIEITGW TESAGRQRVL TQFPGKRIFV ASIRGDVQQQ VKTLEKTTVA DTNTEWSKLQ 
ATAWMKKGDM VNDIKPIWAY ADSLYNGTCN QCHGAPEIAH FDANGWIGTL NGMIGFTSLD 
KREERTLLKY LQMNASDTAG KAHGDKKEEK