Gene EcHS_A1087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1087
Symbol	appB
ID	5591422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1100910
End bp	1102046
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	53%
IMG OID	640920252
Product	cytochrome bd-II oxidase, subunit II
Protein accession	YP_001457816
Protein GI	157160498
COG category	[C] Energy production and conversion
COG ID	[COG1294] Cytochrome bd-type quinol oxidase, subunit 2
TIGRFAM ID	[TIGR00203] cytochrome d oxidase, subunit II (cydB)

Plasmid Coverage information

Num covering plasmid clones	60
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGATT ATGAAACATT GCGCTTCATC TGGTGGCTGC TGATTGGCGT GATCCTGGTG 
GTCTTTATGA TCTCCGACGG ATTTGACATG GGGATCGGCT GTCTGCTGCC GCTGGTGGCG 
CGTAATGATG ATGAACGCCG GATAGTGATA AACAGCGTTG GTGCACACTG GGAAGGCAAC 
CAGGTCTGGT TGATCCTCGC TGGTGGGGCA TTATTTGCCG CCTGGCCCAG AGTGTATGCA 
GCGGCGTTTT CCGGCTTTTA TGTGGCGATG ATCCTGGTGC TGTGCTCACT GTTCTTCCGC 
CCGCTGGCCT TTGATTATCG CGGAAAAATC GCCGATGCAC GCTGGCGTAA AATGTGGGAC 
GCCGGTCTGG TCATCGGCAG TCTGGTGCCG CCGGTAGTCT TCGGTATCGC CTTCGGCAAC 
TTGTTGCTCG GCGTGCCGTT TGCCTTCACA CCGCAATTAC GCGTGGAGTA TCTCGGCAGC 
TTCTGGCAAC TGCTGACGCC ATTCCCTTTA TTGTGCGGAT TGCTCAGCCT TGGGATGGTG 
ATTTTGCAAG GTGGCGTCTG GTTACAACTG AAAACTGTTG GTGTGATTCA TCTGCGTTCA 
CAGCTGGCCA CCAAACGCGC TGCACTGTTG GTGATGCTGT GCTTTTTGCT GGCGGGTTAC 
TGGCTGTGGG TCGGTATTGA TGGCTTTGTA CTGCTCGCCC AGGATGCTAA CGGTCCTTCC 
AATCCGTTAA TGAAACTGGT GGCAGTGCTA CCTGGTGCCT GGATGAATAA TTTCGTCGAA 
TCGCCCGTTT TGTGGATCTT CCCGCTGCTG GGGTTCTTCT GCCCATTGCT GACGGTGATG 
GCGATTTATC GTGGTCGCCC GGGTTGGGGA TTTTTAATGG CGTCATTGAT GCAATTTGGC 
GTGATTTTCA CGGCAGGCAT CACGCTGTTC CCCTTTGTCA TGCCGTCAAG CGTGAGTCCA 
ATCTCCAGCC TGACGTTGTG GGACAGCACT TCCAGTCAGC TGACGCTGAG CATTATGTTG 
GTAATCGTGC TGATATTTTT GCCCATTGTG TTGCTCTACA CTCTCTGGAG CTACTACAAA 
ATGTGGGGAC GCATGACAAC AGAAACTCTC CGCCGTAACG AAAACGAGTT GTACTAA

Protein sequence

MFDYETLRFI WWLLIGVILV VFMISDGFDM GIGCLLPLVA RNDDERRIVI NSVGAHWEGN 
QVWLILAGGA LFAAWPRVYA AAFSGFYVAM ILVLCSLFFR PLAFDYRGKI ADARWRKMWD 
AGLVIGSLVP PVVFGIAFGN LLLGVPFAFT PQLRVEYLGS FWQLLTPFPL LCGLLSLGMV 
ILQGGVWLQL KTVGVIHLRS QLATKRAALL VMLCFLLAGY WLWVGIDGFV LLAQDANGPS 
NPLMKLVAVL PGAWMNNFVE SPVLWIFPLL GFFCPLLTVM AIYRGRPGWG FLMASLMQFG 
VIFTAGITLF PFVMPSSVSP ISSLTLWDST SSQLTLSIML VIVLIFLPIV LLYTLWSYYK 
MWGRMTTETL RRNENELY