Gene RPB_3991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3991
Symbol
ID	3911798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4557829
End bp	4559172
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	68%
IMG OID	637885895
Product	light harvesting pigment MFS transporter Bch2
Protein accession	YP_487595
Protein GI	86751099
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.772479
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.25213
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCGAC CATTGTCTTG GCTTGGCATT GTCCGAATGG GTCTGGTGCA AACCGGCCTT 
GGCGCCATCG TCGTGCTCAC CACCTCGACC TTGAACCGCG TGATGGTGGT GGAACTGGCA 
CTTCCGGCGA TGCTGCCGGG CGCGCTGGTC GCGATCCACT ATGCGCTGCA GGTGTTCCGC 
CCGGCCTGGG GCCACGGCTC CGACCGCGGC GCGCGGCGGA CGCCATGGAT CATCGGCGGC 
ATGGCCGTGC TCGCGCTCGG CGGCTTCCTC GCTGCAGTCG CGACGGCATG GATGAGCACG 
CAGCCGCTGT TCGGCGTGGC TCTCGCCATC GTCGCGTTTT GTCTGATCGG CGGTGGCGTC 
GGCGCGGCCG GAACATCGCT GTTGGTGCTG CTCGCCAAGC GCACCGACGA ACGCCGACGC 
GCGGCGGCGG CGACCATAGT GTGGGTGATG ATGATCGCAG GATTTATCGT CACCACCGGC 
TTCGCCGGCC ATCTGCTCGA TCCGTTCTCG CCGGCGCGGC TGGTCGCGGT GTCGGGCGGG 
GTCTCGGTGA TCGCGATGCT GCTCACTTTC GTCGGCGTCT GGGGCATCGA AGGCAAAGCG 
GCCACCGCCG AGGTGGTGGC AAAGCAAGCG GCCGACAAGG GCTCGTTCCG CGCCGCCTTC 
AAGGAAGTCT GGGCCGAGCC GCAGGCGCGC CGGTTCGCGA TCTTCGTATT CGTGTCGATG 
CTCGCCTACA GCGCTCAGGA CCTGATCCTG GAGCCGTTCG CCGGTGCAGT GTTCGGTTTC 
ACGCCGGGCG AGACCACCAA ATTGTCGAGC GTGCAGCATG GCGGCACGCT GATCGGCATG 
GCGCTCGTGC CGCTGATCGG CGCGCTGTTT CCTCGATCGC GCGGCAATTT GCAGATCTGG 
ACCGTCGGCG GCTGCATCGC CTCGGCGATC GCCTTGCTGG GCCTGTCGAC GGCTGCGATG 
GTCGGGCCGT CCTGGCCGCT GCGGGAAACC GTGTTTCTGC TCGGCATCAC CAACGGCGCC 
TATGCGGTCG CGGCGATCGG CTCGATGATG GAACTGGTCA CCGCCGGCGG CGAAAAGCGC 
GAAGGCGTCC GCATGGGGTT GTGGGGCGCG GCGCAGGCGA TCGCCTTCGG CATCGGCGGC 
TTCGTCGGGA CTCTGGCCAG CGACGTCGCG CGCTTCATCC TGTCGTCGCC GGCGCTGTCC 
TATGCGTCGG TGTTCGCCGC TGAGGCGGGA CTGTTCATTG CCTCCGCCGC GATGGCCGTC 
TGGGTGCATC GCGCCCAGGT CCGTTCTGCC CGAAATCAGA GTCAAGTCGT CGGTCTGTCC 
AACGCCGCGG TTGCGGGAGG GTGA

Protein sequence

MMRPLSWLGI VRMGLVQTGL GAIVVLTTST LNRVMVVELA LPAMLPGALV AIHYALQVFR 
PAWGHGSDRG ARRTPWIIGG MAVLALGGFL AAVATAWMST QPLFGVALAI VAFCLIGGGV 
GAAGTSLLVL LAKRTDERRR AAAATIVWVM MIAGFIVTTG FAGHLLDPFS PARLVAVSGG 
VSVIAMLLTF VGVWGIEGKA ATAEVVAKQA ADKGSFRAAF KEVWAEPQAR RFAIFVFVSM 
LAYSAQDLIL EPFAGAVFGF TPGETTKLSS VQHGGTLIGM ALVPLIGALF PRSRGNLQIW 
TVGGCIASAI ALLGLSTAAM VGPSWPLRET VFLLGITNGA YAVAAIGSMM ELVTAGGEKR 
EGVRMGLWGA AQAIAFGIGG FVGTLASDVA RFILSSPALS YASVFAAEAG LFIASAAMAV 
WVHRAQVRSA RNQSQVVGLS NAAVAGG