Gene RPD_2016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2016
Symbol
ID	4022498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2256871
End bp	2257884
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	65%
IMG OID	637962209
Product	helix-turn-helix, AraC type
Protein accession	YP_569152
Protein GI	91976493
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.775472
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.391158
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGTCCC TACCCCGCCT GTTTTACGTC ACCTCCGGCC TCGACGAGGC CACCGCTTTT 
GCGACCTGGA GTGCGGTGAT TTCGCCGCTG TTCGAACCTC GCCCGTGCCG CCCCGGCACC 
AAGACGCCCA CCGGATCGGC CTCCGGAATC ATCATCGGCG ATCTCATCAT CGCGAAGGTC 
GCATTCAATG CGCAGGACTT CGTGCGCGAC GATCAGCGTA TCGCCGCAAC GCCGGATCAC 
CTGTTGCTGC AGCTCTACGT CACCGGCGGT TTCAACGGCA TCGTCACCCG GCAGCAGACC 
GCTATCGGGC CCGGCAAGGT CGCGCTGATC GATCTGGCGT GTCCGATCGC GACCCGTGCC 
TTCGCATCCA GCACGGTCTG CCTGATCGTT CCGCGCAAGC TTCTCGGTGA CCTGCCGTTA 
GACGCGCTCA AGCCCCGGCT CGATGCGTTC CGCAACAATC TGCTCGCAGC GCAGATGCTG 
TCGCTGCAGG AACGCAGCGC GCAATTGACC GAGGCGGACG TGGCGCGCAC GATCGCCGAA 
ACGACGGATT TCCTGAAACG GCTGCTTGCT CCCGCGCCGG ACGATACGCT GGCGCCGCAA 
AACGGAAGCG ACGAGACGAT CCTGACGCTC ACGGAAGCAC TGATACGCGA CAACCTCGCC 
TTGCCCGAAC TGTCGCCGGA TTGGCTGGCG CAGAAGCTCG ATGTCTCGCG CGCGTCGTTG 
TATCGCCTGT TCGCGGACCG TGGCGGCATC ATGCGCCATG TACAGGAACG CCGGCTCCTC 
GCCGTTCAGG CGGCTCTGAG CGATCCGATC GAAACGCGGC GTCTGTCCCG CCTCGCCTCC 
GACCTCGGGT TCAAGAGCGA AGCGCATTTC AGTCGGAGCT TCCGCGCCCG CTTCGGCGTG 
ACCGCCAGCG CGTATCGCAA GGCGCAACTC GACGCATCCG CTGCGATCCA GCTCACCAGC 
CCGGCTGTCG TGCAACAATG GTGGACGGCG GTCGGTTCGA CTTCGCGAGA CTGA

Protein sequence

MVSLPRLFYV TSGLDEATAF ATWSAVISPL FEPRPCRPGT KTPTGSASGI IIGDLIIAKV 
AFNAQDFVRD DQRIAATPDH LLLQLYVTGG FNGIVTRQQT AIGPGKVALI DLACPIATRA 
FASSTVCLIV PRKLLGDLPL DALKPRLDAF RNNLLAAQML SLQERSAQLT EADVARTIAE 
TTDFLKRLLA PAPDDTLAPQ NGSDETILTL TEALIRDNLA LPELSPDWLA QKLDVSRASL 
YRLFADRGGI MRHVQERRLL AVQAALSDPI ETRRLSRLAS DLGFKSEAHF SRSFRARFGV 
TASAYRKAQL DASAAIQLTS PAVVQQWWTA VGSTSRD