Gene ECH74115_0836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0836
Symbol	cydB1
ID	6968350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	860819
End bp	861958
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	54%
IMG OID	643384861
Product	cytochrome d ubiquinol oxidase, subunit II
Protein accession	YP_002269367
Protein GI	209398213
COG category	[C] Energy production and conversion
COG ID	[COG1294] Cytochrome bd-type quinol oxidase, subunit 2
TIGRFAM ID	[TIGR00203] cytochrome d oxidase, subunit II (cydB)

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00113751
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.902807
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGATT ATGAAGTATT GCGTTTTATC TGGTGGCTGC TGGTTGGCGT TCTGCTGATT 
GGTTTTGCAG TCACTGATGG TTTCGACATG GGGGTGGGCA TGCTCACCCG TTTCCTCGGT 
CGTAACGACA CCGAGCGTCG AATTATGATT AACTCCATCG CACCACACTG GGACGGTAAC 
CAGGTTTGGC TGATCACCGC AGGCGGCGCA CTGTTTGCTG CCTGGCCGAT GGTCTATGCC 
GCTGCGTTCT CCGGCTTCTA TGTGGCGATG ATCCTCGTGC TGGCGTCTTT GTTCTTCCGT 
CCGGTCGGTT TTGACTACCG CTCCAAGATT GAAGAAACCC GCTGGCGTAA CATGTGGGAC 
TGGGGCATCT TCATTGGTAG CTTCGTTCCG CCGTTGGTGA TTGGTGTAGC GTTCGGTAAC 
CTGTTGCAGG GCGTACCGTT CAACGTTGAT GAATATCTGC GTCTGTACTA CACCGGTAAC 
TTCTTCCAGC TGCTTAACCC GTTCGGCCTG CTGGCAGGCG TGGTGAGCGT AGGGATGATC 
ATTACTCAGG GCGCAACCTA TCTGCAAATG CGTACCGTGG GCGAACTGCA CCTGCGTACC 
CGTGCAACGG CTCAGGTGGC GGCACTGGTG ACACTGGTCT GTTTCGCACT GGCTGGCGTA 
TGGGTGATGT ACGGTATCGA TGGTTATGTC GTGAAATCGA CAATGGACCA TTACGCAGCC 
TCTAACCCGC TGAATAAAGA AGTGGTTCGT GAAGCTGGCG CATGGCTGGT TAACTTCAAC 
AACACGCCAA TTCTGTGGGC TATTCCGGCA CTGGGTGTGG TTCTGCCGCT GCTGACCATC 
CTGACTGCAC GTATGGATAA AGCCGCGTGG GCGTTTGTGT TCTCCTCCCT GACGCTGGCC 
TGCATCATCC TGACTGCCGG TATCGCAATG TTCCCGTTTG TGATGCCGTC CAGCACCATG 
ATGAACGCAA GTCTGACAAT GTGGGATGCA ACTTCCAGCC AGCTGACACT TAACGTCATG 
ACCTGGGTTG CGGTGGTTCT GGTACCGATC ATTCTGCTCT ACACCGCCTG GTGTTACTGG 
AAAATGTTCG GTCGTATCAC CAAAGAAGAT ATTGAACGTA ACACCCACTC TCTGTACTAA

Protein sequence

MIDYEVLRFI WWLLVGVLLI GFAVTDGFDM GVGMLTRFLG RNDTERRIMI NSIAPHWDGN 
QVWLITAGGA LFAAWPMVYA AAFSGFYVAM ILVLASLFFR PVGFDYRSKI EETRWRNMWD 
WGIFIGSFVP PLVIGVAFGN LLQGVPFNVD EYLRLYYTGN FFQLLNPFGL LAGVVSVGMI 
ITQGATYLQM RTVGELHLRT RATAQVAALV TLVCFALAGV WVMYGIDGYV VKSTMDHYAA 
SNPLNKEVVR EAGAWLVNFN NTPILWAIPA LGVVLPLLTI LTARMDKAAW AFVFSSLTLA 
CIILTAGIAM FPFVMPSSTM MNASLTMWDA TSSQLTLNVM TWVAVVLVPI ILLYTAWCYW 
KMFGRITKED IERNTHSLY