Gene RPB_4671 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4671
Symbol
ID	3912489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	5284188
End bp	5285192
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	67%
IMG OID	637886576
Product	cytochrome d ubiquinol oxidase, subunit II
Protein accession	YP_488265
Protein GI	86751769
COG category	[C] Energy production and conversion
COG ID	[COG1294] Cytochrome bd-type quinol oxidase, subunit 2
TIGRFAM ID	[TIGR00203] cytochrome d oxidase, subunit II (cydB)

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.297118
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTACG ATCTCGCGAC CATCTGGGCC CTCATCATCG CGTTCGCGGT GTTCGTCTAT 
GTGGTGATGG ACGGCTTCGA CCTCGGCCTC GGCATTCTGT TTCCGCTGTT TCGCACCAAG 
CGCGACCGCG ATGTCGTGAT GAACAGCGTC GCGCCGGTGT GGGACGGCAA CGAGACCTGG 
CTGGTGCTCG GCGGCGGCGG CCTGTTCGCG GCGTTTCCGC TGGCCTATGC GGTGCTGATG 
CCGGCGCTGT ATACGCCGAT CATCGCGATG CTGCTCGGCC TGGTGTTTCG CGGCGTCGCG 
TTCGAATTTC GCTGGCGCAG CCTGCGCGAG CGCAACCGCT GGGACCTCGC CTTCTTCCTC 
GGCTCGCTGA TCGCGACGCT GGCGCAGGGC ATCGCGCTCG GCGCGATCCT GCAAGGCGTC 
GCTGTCGAGG GTCGCGCCTA TGCGGGCGGA TGGTGGGACT GGCTGACGCC GTTCAGCGTG 
CTGACCGGGC TGGCGCTGGT GACCGGCTAC GCGCTGCTCG GCGCCACCTG GCTGGTGATG 
AAGACCACCG GCGAACTGCG CGACCAGGCC TATCGGCTGA GCCGCTGGCT GCTGCTGGCG 
ATGCTGATCG CGATCGTCGC CGTCAGCGCC GCGACGCCGT TCCTGAGCTA CGACTATTCG 
GAACGCTGGT TCGCCTGGCC GAACGTGCTC GCCACCGCGC AAGTGCCGCT CGCCGTGGCG 
ATCGTCACCG CGCTGCTGCT GCGGGCGCTG ACGCAGCGCC GCGACTACCA GCCGTTCCTG 
CTGACGCTGT GCCTGTTCGC GCTGTCCTAT GCCGGGCTCG GCATCAGCAT CTGGCCCTAT 
GTGGTGCCGC GGAGCATCAC CGTCTGGCAG GCGGCGGCGC CCGAGAGCAG CCAGCTCTTC 
ATGCTGGTCG GCGTCGCGAT CCTGGTGCCG ATCATCCTCG TCTACACAGC CTGGGCCTAT 
TGGGTGTTTC GCGGCAAGGT CGACCCCGAC AGCGGCTATC ATTGA

Protein sequence

MDYDLATIWA LIIAFAVFVY VVMDGFDLGL GILFPLFRTK RDRDVVMNSV APVWDGNETW 
LVLGGGGLFA AFPLAYAVLM PALYTPIIAM LLGLVFRGVA FEFRWRSLRE RNRWDLAFFL 
GSLIATLAQG IALGAILQGV AVEGRAYAGG WWDWLTPFSV LTGLALVTGY ALLGATWLVM 
KTTGELRDQA YRLSRWLLLA MLIAIVAVSA ATPFLSYDYS ERWFAWPNVL ATAQVPLAVA 
IVTALLLRAL TQRRDYQPFL LTLCLFALSY AGLGISIWPY VVPRSITVWQ AAAPESSQLF 
MLVGVAILVP IILVYTAWAY WVFRGKVDPD SGYH