Gene Rsph17029_3942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3942
Symbol
ID	4898329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	1076056
End bp	1077066
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	71%
IMG OID	640114545
Product	AraC family transcriptional regulator
Protein accession	YP_001045792
Protein GI	126464679
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.466068
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGCCGG GCGCGGCCTA TTATCCGGTG CAGAGCGCGG GCGACACGCG CAGCTACGCC 
TTCCTGCTGG TGCCGGGCTT CACGCTTCTG GCCTTCAGTT CCGCCGTCGA GCCGCTGCGC 
ATCGCCAACC AGCTGTCGCA GAAGCCGCTC TACCGGTGGC GCGTCCTGTC CGAAGGCGGG 
CGTCCGGTCG CCAGCTCCTC GGGCATCACG GTGGCGGCCG ACGAGGCGCT GGGGCCGCTC 
GACCGCGAGA CCGACCTCAT GGTCTGCGCG GGCAACATCC CCTCAGCCGC AGCCGCCTCG 
GCGGTGGTGG CCACCGTCCA GCGCCACCAC CGCTTCGGCG GCACGGTGGG CGGCATCTGC 
ACCGGGGCCT TCGCGCTCGC CCATGCGGGC GTGCTGGAAG ACCGCCGCTT CACCCTCCAC 
TGGGAGAACC AGCCCGGCTT TCTCGAGGAT TTCCCCCGCC TCGTGCCGAC CTCGAACCGG 
TTCGAGAGCG CGGGCCGCAC GCTGACCTGC GGCGGCGGGG CAGCCTCGAC CGACATGATG 
CTCTCGCTGA TCGCGCGGGA CCATGGCGCC GATTTCGCCG CCATGGTCTC GGACATGTGC 
CTGCGCACCG TGCTCGCGGG GGCCGCGCCC GAGCAGCGCA GCTCGCTCGC CGCCCTGATG 
CGCTCGCGCA GCCCCGCGCT GATCGCGGTG GTGAAACTCA TGAACGAGCA TCTGGAGGAC 
ACGCTCTCGC TCGAGGAACT GTCCGACGCC GCGGGCTGCT CGCGCCGCCA TGTCGAACGC 
CTCTTCAAGG CCACGGTGGG CGAGACCCCG AACGGCTTCT ACCGCGGCCT GCGGCTCGAC 
CGGGGGCGCA ATCTGCTCAG CACCACCGAC ATGACGCTTC TCGAAGTGGC GACGGCCTGC 
GGCTTCAACT CGGTCTCGCA TTTCTCGAAA TGCTTCAAGG CTCGGTTCGG GACGGTGCCC 
ACGCGCTTCA GCCACCGCAG CCGCAGCCCG AGCCGGATGG CGCGCGCCTA G

Protein sequence

MPPGAAYYPV QSAGDTRSYA FLLVPGFTLL AFSSAVEPLR IANQLSQKPL YRWRVLSEGG 
RPVASSSGIT VAADEALGPL DRETDLMVCA GNIPSAAAAS AVVATVQRHH RFGGTVGGIC 
TGAFALAHAG VLEDRRFTLH WENQPGFLED FPRLVPTSNR FESAGRTLTC GGGAASTDMM 
LSLIARDHGA DFAAMVSDMC LRTVLAGAAP EQRSSLAALM RSRSPALIAV VKLMNEHLED 
TLSLEELSDA AGCSRRHVER LFKATVGETP NGFYRGLRLD RGRNLLSTTD MTLLEVATAC 
GFNSVSHFSK CFKARFGTVP TRFSHRSRSP SRMARA