Gene RSP_2026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_2026
Symbol
ID	3719360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	+
Start bp	624857
End bp	625834
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	72%
IMG OID	640070190
Product	AraC family transcriptional regulator
Protein accession	YP_352078
Protein GI	77462574
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAGACG GAAACGCCAG TTTCCGGACG CAGCGTTTCA CGGGCGGCGA TGCGGCGCAG 
CCCCTGCCGT CGATCATGTT CGCCGAACGG CGCAGGCTGG CCATCCTCGG CGAAAACGGG 
TTCGTCGAGA CCTGCGTGCG GACCATCGAG GGCAGCGACA TCGTCTTCGG CAGTGTCCGG 
TCGTCCGGGC ATGTGATCGA GCTTCGCGAG CCGGATCGGT TGACCCTCCT TCTGCCGAGG 
GCGGGGCGCC TGCGGGTGCG GATCGGGTCT GCCGAGCATG GCGTGACGCC GGGCTGCCCC 
ATGGCCTTCC GGCCGGGCGA GCGGGTGACC GACGCCACCG CCGGCCGCGA CGGGCTCTTC 
GCCGCGATCA CGCTGCAGGT GCCCGCCGCG CGGGTCCGGG CGCTGGCCGA GGCGGCCGAG 
CTACCGCTGC GGGGTCTGCT CGGCCCGGAT GCCGTGGCCC TGCGCGCCCG GCTCGAGGCT 
TCGGCGCTGG AGGGCATGGC CCGGCTGGCC TGCGACCTCT TCCTGCGGCC GAAGACCGCC 
CTTCCGCCCG GCGTCGCTCT GGCGATCACC GACTTCGTGG ATGCGCAGCT GCTGGCCCTG 
ATGGACGGCC GGCCTGCTCC GGCCCGATGC CGCGTCCTGT CGGCCTTCCA CCGCGTGCGG 
GCGGCCGAAG AGATCATGCA TGCCCACAGC GAAGAGCCGC TCGCCATGCT CGATCTCGCA 
CGACGTCTGG ATATCGGCCT GCGCAGCCTG CAGCTGGCCT TCCGCGAGGT GCATGACGGC 
CTCTCGCCGC GCGAGGTCTA CAGCCGGATC CGGCTGGACC GCGCGCGGCA GCGGCTGCTG 
GCGGCTTCGG GGGCCGATCG GGTGACGACC ATCGCGCTCG ACAGCGGCTT CGGTCATCTC 
GGGCGGTTCG CCATGGCCTA TGCGCGCACC TTCGGCGAGC TGCCGAGCGA GACGCTTGCC 
CGCCGCCGCA GGATTTGA

Protein sequence

MPDGNASFRT QRFTGGDAAQ PLPSIMFAER RRLAILGENG FVETCVRTIE GSDIVFGSVR 
SSGHVIELRE PDRLTLLLPR AGRLRVRIGS AEHGVTPGCP MAFRPGERVT DATAGRDGLF 
AAITLQVPAA RVRALAEAAE LPLRGLLGPD AVALRARLEA SALEGMARLA CDLFLRPKTA 
LPPGVALAIT DFVDAQLLAL MDGRPAPARC RVLSAFHRVR AAEEIMHAHS EEPLAMLDLA 
RRLDIGLRSL QLAFREVHDG LSPREVYSRI RLDRARQRLL AASGADRVTT IALDSGFGHL 
GRFAMAYART FGELPSETLA RRRRI