Gene RPB_2984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2984
Symbol
ID	3910783
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	3397938
End bp	3398948
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	64%
IMG OID	637884890
Product	AraC family transcriptional regulator
Protein accession	YP_486597
Protein GI	86750101
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0543899
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACCGC CGTCCGACGC TCATTCGACC TGCCAGACAC CTCCCACCGA GCTACTGAAG 
GACTTCGCGA TCCTTCGCAC CAATGATCCG GACACCGCGC GCAAGCTGGT CTGGAGTCGG 
TTCGGCCTCA ATCTATCGAC GCCGAGGATT GAAGGATTCT TCTCCCGGGC CAACATCGCG 
GAACTGCCAA ATGTTTCGCT ATATTTCTGC GCCAACTCCA CGCCCGTCGC GCTGCAGATC 
CCGAACAGCA AGGGCGCTCA TGTGCACCTG TGCCTGCGCG GCCGCGGCAC GCTGATACAT 
GACCGCCGCC GCATCGAGAT CGGCGAAGGC GAGGCGTTCG TCTGTTCGCC CGGCAAGCCT 
GCTTTGCTCG ATTTCGCCGC AGGCTATGAG GAACTGGCGC TGCACGTCCC GGTGCCGATG 
CTGGAGCGAA CCTTCGCCGC GCTGACCGGG TTGGGGCCGC ACACGACGAT CGCGTTCGAG 
CCCGAGATCA TCACCGACGA TCCGCACTAT GCAGGCTTCC GCGATCTCGT GCTGCTGCTC 
GCCGGAAGCC TCGATGCCGC ATTCTCCGCC TGGCCAAAGG CGACGATCGC GCAACTCGAG 
CTGGCCTGCG TGTCGCAACT TCTGTACTGC ACATCGCACA ATCTCCGTCG CGTGCTCTGT 
CCGGAAGATT TCGGCGCGGT GCCCAGCCTG GTCCGCATCG CCGAGCATTA TATCGAGAGC 
CGCTGCGAGT CCGACGCCAG CGTCGACGAT ATTGCGCGAG CGTGCGCCGT CAGCGTCTCG 
ACTCTGACCC GGATGTTTAT GAAGTACCGC GGCTACTCGC CCGCCGCTTT CATCAAGCGC 
GCCAAACTGG CGCGCGCCAG ACAGTTACTC GAATCCCGCG CAGCCAGCAC GGTGGTCGGC 
GTCGCGCTGC GCTGCGGCTT CGCCAATCCG AGCCGCTTCG CCAAGGACTA TCGCGAGGCG 
TTCGGGGAGT CGCCGACCGA GACGCTGCGG CGACGGCGAC CGCAAGACTG A

Protein sequence

MPPPSDAHST CQTPPTELLK DFAILRTNDP DTARKLVWSR FGLNLSTPRI EGFFSRANIA 
ELPNVSLYFC ANSTPVALQI PNSKGAHVHL CLRGRGTLIH DRRRIEIGEG EAFVCSPGKP 
ALLDFAAGYE ELALHVPVPM LERTFAALTG LGPHTTIAFE PEIITDDPHY AGFRDLVLLL 
AGSLDAAFSA WPKATIAQLE LACVSQLLYC TSHNLRRVLC PEDFGAVPSL VRIAEHYIES 
RCESDASVDD IARACAVSVS TLTRMFMKYR GYSPAAFIKR AKLARARQLL ESRAASTVVG 
VALRCGFANP SRFAKDYREA FGESPTETLR RRRPQD