Gene B21_00989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_00989
Symbol	appB
ID	8115401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	1043795
End bp	1044931
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	53%
IMG OID	644847251
Product	hypothetical protein
Protein accession	YP_002998824
Protein GI	251784520
COG category	[C] Energy production and conversion
COG ID	[COG1294] Cytochrome bd-type quinol oxidase, subunit 2
TIGRFAM ID	[TIGR00203] cytochrome d oxidase, subunit II (cydB)

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.787651
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGATT ATGAAACATT GCGCTTCATC TGGTGGCTGC TGATTGGCGT GATCCTGGTG 
GTCTTTATGA TCTCCGACGG ATTTGACATG GGGATCGGCT GTCTGCTGCC GCTGGTGGCG 
CGTAATGATG ATGAACGCCG GATAGTGATA AACAGCGTTG GTGCACACTG GGAAGGCAAC 
CAGGTCTGGT TGATCCTCGC TGGTGGGGCA TTATTTGCCG CCTGGCCCAG AGTGTATGCA 
GCGGCGTTTT CCGGCTTTTA TGTGGCGATG ATCCTGGTGC TGTGCTCACT GTTCTTCCGC 
CCGCTGGCCT TTGATTATCG CGGAAAAATC GCCGATGCAC GCTGGCGTAA AATGTGGGAC 
GCCGGTCTGG TCATCGGCAG TCTGGTGCCG CCGGTAGTCT TCGGTATCGC CTTCGGCAAC 
TTGTTGCTCG GCGTGCCGTT TGCCTTCACA CCGCAATTAC GCGTGGAGTA TCTCGGCAGC 
TTCTGGCAAC TGCTGACGCC ATTCCCTTTA TTGTGCGGAT TGCTCAGCCT TGGGATGGTG 
ATTTTGCAAG GTGGCGTCTG GTTACAACTG AAAACTGTTG GTGTGATTCA TCTGCGTTCA 
CAGCTGGCGA CCAAACGCGC TGCACTGTTG GTGATGCTGT GCTTTTTGCT GGCGGGTTAC 
TGGCTGTGGG TCGGTATTGA TGGCTTTGTA CTGCTCGCCC AGGATGCTAA CGGTCCTTCC 
AATCCGTTAA TGAAACTGGT GGCAGTGCTA CCTGGTGCCT GGATGAATAA TTTTGTCGAG 
TCGCCCGTTT TGTGGATCTT CCCGCTGCTG GGATTCTTCT GCCCATTGCT GACGGTGATG 
GCGATTTATC GTGGTCGCCC GGGTTGGGGA TTTTTGATGG CATCATTGAT GCAATTTGGC 
GTGATTTTCA CGGCAGGCAT CACGCTGTTC CCCTTTGTCA TGCCGTCAAG CGTGAGTCCG 
ATCTCCAGCC TGACGTTGTG GGACAGTACT TCCAGTCAGC TGACGCTGAG CATTATGTTG 
GTAATCGTGC TGATATTTTT GCCCATTGTG TTGCTCTACA CTCTCTGGAG CTACTACAAA 
ATGTGGGGGC GCATGACAAC AGAAACTCTC CGCCGTAACG AAAACGAGTT GTACTAA

Protein sequence

MFDYETLRFI WWLLIGVILV VFMISDGFDM GIGCLLPLVA RNDDERRIVI NSVGAHWEGN 
QVWLILAGGA LFAAWPRVYA AAFSGFYVAM ILVLCSLFFR PLAFDYRGKI ADARWRKMWD 
AGLVIGSLVP PVVFGIAFGN LLLGVPFAFT PQLRVEYLGS FWQLLTPFPL LCGLLSLGMV 
ILQGGVWLQL KTVGVIHLRS QLATKRAALL VMLCFLLAGY WLWVGIDGFV LLAQDANGPS 
NPLMKLVAVL PGAWMNNFVE SPVLWIFPLL GFFCPLLTVM AIYRGRPGWG FLMASLMQFG 
VIFTAGITLF PFVMPSSVSP ISSLTLWDST SSQLTLSIML VIVLIFLPIV LLYTLWSYYK 
MWGRMTTETL RRNENELY