Gene Haur_2244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2244
Symbol
ID	5734131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	2861114
End bp	2862124
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	52%
IMG OID	641279385
Product	cytochrome bd ubiquinol oxidase subunit II
Protein accession	YP_001545012
Protein GI	159898765
COG category	[C] Energy production and conversion
COG ID	[COG1294] Cytochrome bd-type quinol oxidase, subunit 2
TIGRFAM ID	[TIGR00203] cytochrome d oxidase, subunit II (cydB)

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.171072
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGCTTG AGGTTGTTGT CGCCGCAATT GGCTTGCTAG GGGTCATTAC CTATGCGATT 
TTGGCAGGCG CTGATTTTGG CGGTGGGATC TGGGATTTAT TGGCGTGGGG GCCGAGGCGC 
ACCCAACAAC GCGAAGCAAT TGCCCATGCG GTTGGCCCCG TTTGGGAGGC CAACCATGTG 
TGGCTGATTT TCATTATTGT CGTGCTGTTT ACAGGCTTTC CTACTGCGTT TGCGGCGTTG 
AGCATTGGGC TATTCGCACC ATTTCATCTC GCGCTATTGG GGATTATCCT GCGGGGCGCG 
GCTTTTGTGT TTCGAGCCTA TAGCCCGCAA AAAGAGCAAC AACCAAGCCA GAGCAGCCAG 
CGTTGGGGTA CGATTTTTGG CGCAGCCAGC GTTATTACCC CAGTGATTTT GGGCATGACG 
CTGAGTGCAG TTTCGGCAGG CCAATTACGG GTAATTGATG GCGTTGTGCA AAGTGAGGGC 
ATTGTTTGGA TGACCCCATT GGCAATTGCG ATGGGGTTAT TAGCCTTGGC GTTATGTGCT 
TATCTCGCCG CCGTCTATAT GACGATTGAA ACGCGCGACG AATTACAGGC TGATTTTCGT 
CAACGCGCCT TGCTAGCTGG TACAGCGGTG GTTGGTTTAT CCTTATTAAG TCTGCCATTA 
CTCTATTTCA CCGCTCAACA TCTATGGGAA GGTTTGATCA GCGTTCGTGC CGCGCCAGTA 
TTGACGATTG GTCTACTTGC CGCCTTACTT TCAGGCTGGG CCTTATTGCG TTGGCGCTTT 
CAACTTGCAC GCGGCGCAGC GATTGTGCAA ATTAGCTGTT TGCTAGCAGG CTGGGGCATC 
GCTCAATATC CCTACATCAT TTATCCCGAT ATCACGTTGG CCACAGCGTC AGCTCCTCGT 
GCCACCCTGA TTTTTATTTT GGTGGCCTTG CCCTTGGGGT TGTTAATCTT ATTGCCATCA 
TTGTGGTTTC TGTTCAAGGT GTTTAAAAGT GCACCACGTG AGGATGCATA G

Protein sequence

MPLEVVVAAI GLLGVITYAI LAGADFGGGI WDLLAWGPRR TQQREAIAHA VGPVWEANHV 
WLIFIIVVLF TGFPTAFAAL SIGLFAPFHL ALLGIILRGA AFVFRAYSPQ KEQQPSQSSQ 
RWGTIFGAAS VITPVILGMT LSAVSAGQLR VIDGVVQSEG IVWMTPLAIA MGLLALALCA 
YLAAVYMTIE TRDELQADFR QRALLAGTAV VGLSLLSLPL LYFTAQHLWE GLISVRAAPV 
LTIGLLAALL SGWALLRWRF QLARGAAIVQ ISCLLAGWGI AQYPYIIYPD ITLATASAPR 
ATLIFILVAL PLGLLILLPS LWFLFKVFKS APREDA