Gene RPD_1089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1089
Symbol
ID	4021565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1239009
End bp	1240115
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	67%
IMG OID	637961281
Product	electron transfer flavoprotein beta-subunit
Protein accession	YP_568228
Protein GI	91975569
COG category	[C] Energy production and conversion
COG ID	[COG2025] Electron transfer flavoprotein, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.419334
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGC CAGCCAAGCC TGCCCCGCAG CCCGCCGGAC GCGCCAACGC CAAGAAAGAG 
CTGTCCGAAC ACTTCAAGCA GTACAAACAC GTCTGGGTGT TCGTCGAACA GGAGCGAGGC 
CACGTCCATC CGGTTTCCTG GGAACTGATG GGTTCCGGCC GCCGACTCGC CGACAAGCTC 
GGCGTCGAAC TCGCGGCGGT GGTGATCGGG CCCGCCGGCG ACGCCACACG CGTCGCGGCG 
GCGGAGTCGT TCTGCTACGG CGCCGATCTC GCTTACATCG TCGCCGATGA CGTGCTCGCC 
GACTATCGCA ACGAGTCCTA CACCAAGGCG CTGACCGATC TGGTCAACAC CTACAAGCCG 
GAAATCCTGC TGCTCGGTGC CACCACGCTC GGCCGGGACC TCGCCGGCGC CGTCGCCACC 
ACGCTGCTGA CGGGACTCAC CGCGGACTGC ACCGAACTCG AGGTTGACGC CGACAATTCG 
CTCGCCGCGA CCCGGCCGAC CTTCGGCGGC TCGCTGCTCT GCACGATCTA CACGCTGAAT 
TTCCGGCCGC AGATGGCGAC GGTGCGGCCG CGGGTGATGG AGATGCCGGA CCGCGTCGAG 
AAGCCGGTCG GCCGCATCAT CGAATTTCCG CTCGGCATGG TCGAAGCCGA CATCGTCACC 
AAGGTGCTGG CGTTCGTGCC GGACCGTGAC AAGGCGACTT CGAACCTGGC TTACGCCGAC 
ATCGTCGTCG CAGGCGGCAT TGGGCTCGGT TCGCCGGAGA ACTTCCAGCT CGTTCGGCAG 
CTCGCCGGGG TGCTCGGCGC CGAATATGGC TGCTCGCGGC CGCTGGTCCA GAAGGGCTGG 
GTCTCGGCCG ACCGGCAGAT CGGCCAGACC GGCAAGACCA TCCGCCCGAA GCTCTACATC 
GCCGCCGGCA TCTCCGGGGC GATCCAGCAT CGCGTCGGCG TGGACGGCGC CGATCTGATC 
GTCGCCATCA ACACCGACAA GAATGCGCCG ATCTTCGACT TCGCGCATCT GGCGATCGTC 
ACCGACGCGA TCCGGCTGTT GCCGGCGCTG ACCGAAGCAT TCCGCAAGCG GCTGTCGCCG 
CACACCCGAG ACCGGATCGC AAGCTGA

Protein sequence

MSQPAKPAPQ PAGRANAKKE LSEHFKQYKH VWVFVEQERG HVHPVSWELM GSGRRLADKL 
GVELAAVVIG PAGDATRVAA AESFCYGADL AYIVADDVLA DYRNESYTKA LTDLVNTYKP 
EILLLGATTL GRDLAGAVAT TLLTGLTADC TELEVDADNS LAATRPTFGG SLLCTIYTLN 
FRPQMATVRP RVMEMPDRVE KPVGRIIEFP LGMVEADIVT KVLAFVPDRD KATSNLAYAD 
IVVAGGIGLG SPENFQLVRQ LAGVLGAEYG CSRPLVQKGW VSADRQIGQT GKTIRPKLYI 
AAGISGAIQH RVGVDGADLI VAINTDKNAP IFDFAHLAIV TDAIRLLPAL TEAFRKRLSP 
HTRDRIAS