Gene RPB_2046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2046
Symbol
ID	3909861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	2324746
End bp	2325726
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	59%
IMG OID	637883939
Product	AraC family transcriptional regulator
Protein accession	YP_485664
Protein GI	86749168
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCAGA GGAATCACTA TTCGACGGCC GCGCTAACCG GGTCTGAAAG CATTGCAGCG 
TGGCGGCAGG CCATGGCTGA AGTGTATTAT CGCCTCGATA TTCAGGCCCG CCACGATGAC 
CGCGTGGTCG GCGAACTGAT CGACGTTCAA CTCGGCTCGC TGGGACTGTC CAACTTCAAG 
GCGGATGCGC AACGGGTGAT CAGGCGCAAG GAGTCCGCGA AGATCGACGG GTCCGAAGAC 
TTCGTCTTTC TGTTTCCGAT CCGAAAGGGC TTGCAATACG AGCAGCGGGG ACGCTCGGGG 
CTAGCCATGC CCGGAACCGT CTTTCTCCTC AACTCTGCCG AAAATTACGT CATCGACGTT 
CCGGACGGGT CCGAAAACAT CACGATCAAG GTCGACCGCC GCCTTCTGAT CGATCGGGTC 
AAAGGGATCG ACGGCCTGTG CGCCTCGATG AATATCGCCA ACTCACAACT CGTTCCGGTT 
GTGACAACGC TCGGCGCGCA ATTGCTCAAT CTTCCGCCGG GAGAGCACGC CGACCGACTC 
CAGCAGTCGG TGATCGACCT GATCTGCCTG ATGCTGGACT TGCGGGAATC GGCACAAGAC 
AAGACCTTCA TCAGGCAGAC GCTGGCCTCG TCGCTGTACC ATCGGATCGA TGCTTACCTG 
CAGCGCAACC TGCACGATTG CGACCTGTCG CCCGATCACG CCGCGCGAGA GCACAAGATC 
TCGGTCCGCT ACCTGCACAA GGTGTTTCAC TTTCACGGCA CCTCGTTCGG CCAGCGCCTC 
CTCGAACTCA GATTGCAGCG TGCGCATTAC GTCATTTCAA GACATGGCGC CACCACCACC 
ATCAATCTTG GTCAGGTGGC CTATGAATGC GGGTTCACGA GCCAGTCCTA TTTCTCGACC 
TGCTATCGGA AACGCTTTGG CTTGACGCCA CGCCAGACCG GGAAGTCCGA TCGACAATCC 
GCCGCCGACG CCGGAAGCTG A

Protein sequence

MNQRNHYSTA ALTGSESIAA WRQAMAEVYY RLDIQARHDD RVVGELIDVQ LGSLGLSNFK 
ADAQRVIRRK ESAKIDGSED FVFLFPIRKG LQYEQRGRSG LAMPGTVFLL NSAENYVIDV 
PDGSENITIK VDRRLLIDRV KGIDGLCASM NIANSQLVPV VTTLGAQLLN LPPGEHADRL 
QQSVIDLICL MLDLRESAQD KTFIRQTLAS SLYHRIDAYL QRNLHDCDLS PDHAAREHKI 
SVRYLHKVFH FHGTSFGQRL LELRLQRAHY VISRHGATTT INLGQVAYEC GFTSQSYFST 
CYRKRFGLTP RQTGKSDRQS AADAGS