Gene Rsph17029_3159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3159
Symbol
ID	4898721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	183130
End bp	184134
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	68%
IMG OID	640113761
Product	AraC family transcriptional regulator
Protein accession	YP_001045031
Protein GI	126463918
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0609208
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCCG CAGCCCCACG GCGTCATGAG CTTTCCATTG CACTGATATT GCAGGACAAG 
TTCACGATTG CCGCTTTCTC CGGTTTCATC GATGCGCTGC GGCTGGCGGC CGACGATGCT 
GCAAAAAGCC GACAGATCCG CGTCGCCTGG AAGGTCTTCG CCCAGCACCG CAGCCCGGTC 
ATGGCCAGCT GCGGGCTGCG CGTGGCCACC GAGGACGGGC TGCCCGTTCC CGAGGACTAT 
GACTATATCG CCATCTGCGG CGGCAATTCC TTTGCCGACG CCGCGCCCGC GCCGCAGCTG 
GCCCAGCTCA TCCAGCGCGC CCACCGCGCG CGGGTGGGGC TCCTCGGCAT CTGTACCGGC 
AGTTTCGCCA TCGCCCACGC AGGGCTGATC GGCGATCGGC GCTTCTGCAT CCACTGGAAC 
GTGGCCGAGC CCTTCAAGGC GCTCTTCCCG CGCGCCCATA TCTCGGTGGA TCGGATCTTC 
ATCGACGAGG GCGACGTCAT CACCTGCGCG GGCTCGACCG CGGCCATCGA CCTCGCGCTC 
TATCTCGTCA TGCGCCACTG CGGACAGGAT CGGGCGCAGC AGGTGATGCG GCACATGATG 
CTCTCGCAGA TGCGCCCCGC CACCATGCCG CAGGCCCATT TCTACCAGCT CCCTCCGGGC 
GACAGCCACC CGCGCCTGCG CCGCGCGCTG CATTTCATGG AGCAGCAGCT CGACCGTCCG 
CCCTCGGTCG GGGCCATCGC GCGCTATTGC GGCGTCTCGG TCCGCCAGCT CGAGCGGATC 
TTCCGTCAGG CGCTGGGGCA GACGCCGAAC GCGGCCTTCC GCCAGATGCG GCTGAATTAC 
GGGCGCTACC TGCTTTCGGC AGGCACGCTG CCCGTCACCG AGATCGCCCA TATCGCGGGC 
TTCTCCGATG CGGCCCATTT CTCGCGCGAG TTCCGCCGTG CCTTTCACGA GACGCCGAGC 
GCCCACCGCC GCGCGCGCAG CCACGGTCCC GACGCGGGCT CATGA

Protein sequence

MKPAAPRRHE LSIALILQDK FTIAAFSGFI DALRLAADDA AKSRQIRVAW KVFAQHRSPV 
MASCGLRVAT EDGLPVPEDY DYIAICGGNS FADAAPAPQL AQLIQRAHRA RVGLLGICTG 
SFAIAHAGLI GDRRFCIHWN VAEPFKALFP RAHISVDRIF IDEGDVITCA GSTAAIDLAL 
YLVMRHCGQD RAQQVMRHMM LSQMRPATMP QAHFYQLPPG DSHPRLRRAL HFMEQQLDRP 
PSVGAIARYC GVSVRQLERI FRQALGQTPN AAFRQMRLNY GRYLLSAGTL PVTEIAHIAG 
FSDAAHFSRE FRRAFHETPS AHRRARSHGP DAGS