Gene EcHS_A0785 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0785
Symbol	cydA
ID	5593430
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	798311
End bp	799879
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	53%
IMG OID	640919959
Product	cytochrome d ubiquinol oxidase, subunit I
Protein accession	YP_001457533
Protein GI	157160215
COG category	[C] Energy production and conversion
COG ID	[COG1271] Cytochrome bd-type quinol oxidase, subunit 1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0000321454
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAGATA TAGTCGAACT GTCGCGCTTA CAGTTTGCCT TGACCGCGAT GTACCACTTC 
CTTTTTGTGC CACTGACGCT CGGTATGGCG TTCCTGCTGG CCATTATGGA AACGGTCTAC 
GTCCTCTCCG GCAAACAGAT TTATAAAGAT ATGACCAAGT TCTGGGGCAA GTTGTTTGGT 
ATCAACTTCG CTCTGGGTGT GGCTACCGGT CTGACCATGG AGTTCCAGTT CGGGACTAAC 
TGGTCTTACT ATTCCCACTA TGTAGGGGAT ATCTTCGGTG CGCCGCTGGC AATCGAAGGT 
CTGATGGCCT TCTTCCTCGA ATCCACCTTT GTAGGTCTGT TCTTCTTCGG TTGGGATCGT 
CTGGGTAAAG TTCAGCATAT GTGTGTCACC TGGCTGGTGG CGCTCGGTTC AAACCTGTCC 
GCACTGTGGA TTCTGGTTGC GAACGGCTGG ATGCAAAACC CAATCGCGTC CGATTTCAAC 
TTTGAAACTA TGCGTATGGA GATGGTGAGC TTCTCCGAGC TGGTGCTTAA CCCGGTTGCT 
CAGGTGAAAT TCGTTCACAC TGTAGCGTCT GGTTATGTGA CTGGCGCGAT GTTCATCCTC 
GGTATCAGCG CATGGTATAT GCTGAAAGGT CGTGACTTCG CCTTCGCTAA ACGCTCCTTT 
GCTATCGCTG CCAGCTTCGG TATGGCTGCT GTTCTGTCTG TTATTGTTCT GGGTGATGAA 
TCCGGCTACG AAATGGGCGA CGTGCAGAAA ACCAAACTGG CTGCTATTGA AGCCGAGTGG 
GAAACGCAAC CTGCGCCTGC TGCCTTTACT CTGTTCGGCA TTCCTGATCA GGAAGAGGAG 
ACGAACAAAT TTGCGATTCA GATCCCTTAC GCACTGGGCA TCATTGCAAC GCGTTCCGTG 
GATACCCCGG TTATCGGCCT GAAAGAGCTG ATGGTGCAGC ATGAAGAACG CATTCGTAAC 
GGGATGAAGG CGTACTCTCT GCTCGAACAA CTGCGTTCTG GTTCTACCGA CCAGGCGGTT 
CGTGACCAGT TCAATAGCAT GAAGAAAGAC CTCGGTTACG GTCTGCTGCT GAAACGCTAT 
ACGCCAAACG TGGCTGATGC GACTGAAGCG CAGATTCAAC AGGCAACCAA AGACTCCATC 
CCGCGTGTAG CGCCGCTGTA CTTTGCGTTC CGTATCATGG TGGCGTGTGG CTTCCTGCTT 
CTGGCAATCA TCGCGCTCTC TTTCTGGAGT GTCATCCGCA ACCGCATTGG CGAGAAAAAA 
TGGCTTCTGC GCGCCGCGCT GTACGGTATT CCGCTGCCGT GGATTGCTGT AGAAGCGGGC 
TGGTTCGTGG CTGAATATGG CCGCCAACCG TGGGCTATCG GTGAAGTGCT GCCGACAGCT 
GTGGCGAACT CGTCACTGAC CGCAGGCGAT CTCATCTTCT CAATGGTGCT GATTTGCGGC 
CTGTATACCC TGTTCCTGGT GGCAGAATTG TTCTTAATGT TCAAGTTTGC ACGCCTCGGC 
CCAAGCAGCC TGAAAACCGG TCGCTATCAC TTTGAGCAGT CTTCCACGAC TACTCAGCCG 
GCACGCTAA

Protein sequence

MLDIVELSRL QFALTAMYHF LFVPLTLGMA FLLAIMETVY VLSGKQIYKD MTKFWGKLFG 
INFALGVATG LTMEFQFGTN WSYYSHYVGD IFGAPLAIEG LMAFFLESTF VGLFFFGWDR 
LGKVQHMCVT WLVALGSNLS ALWILVANGW MQNPIASDFN FETMRMEMVS FSELVLNPVA 
QVKFVHTVAS GYVTGAMFIL GISAWYMLKG RDFAFAKRSF AIAASFGMAA VLSVIVLGDE 
SGYEMGDVQK TKLAAIEAEW ETQPAPAAFT LFGIPDQEEE TNKFAIQIPY ALGIIATRSV 
DTPVIGLKEL MVQHEERIRN GMKAYSLLEQ LRSGSTDQAV RDQFNSMKKD LGYGLLLKRY 
TPNVADATEA QIQQATKDSI PRVAPLYFAF RIMVACGFLL LAIIALSFWS VIRNRIGEKK 
WLLRAALYGI PLPWIAVEAG WFVAEYGRQP WAIGEVLPTA VANSSLTAGD LIFSMVLICG 
LYTLFLVAEL FLMFKFARLG PSSLKTGRYH FEQSSTTTQP AR