Gene Rsph17029_0737 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0737
Symbol
ID	4895850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	746181
End bp	747158
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	72%
IMG OID	640111321
Product	helix-turn-helix domain-containing protein
Protein accession	YP_001042622
Protein GI	126461508
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.396346
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGACG GGAACGCCAG TTTCCGGACG CAGTGTTTCA AGGGCGGCGA TGCGGCGCAG 
CCCCTGCCGT CGATCATGTT CGCCGAACGG CGCAGGCTGG CCATCCTCGG CGAAAACGGG 
TTCGTCGAGA CCTGCGTGCG GACCATCGAG GGCAGCGACA TCGTCTTCGG CAGTGTCCGG 
TCGTCCGGGC ATGTGATCGA GCTTCGCGAG CCGGATCGGC TGACCCTCCT TCTGCCGCGG 
GCGGGGCGCC TGCGGGTGCG GATCGGGCCT GCCGAGCATG GCGTGACGCC GGGCTGCCCC 
ATGGCCTTCC GGCCGGGCGA GCGGGTGACC GACGCCACCG CCGGCCGCGA CGGGCTCTTC 
GCCGCGATCA CGCTGCAGGT GCCCGCCGCG CGGGTCCGGG CGCTGGCCGA GGCGGCCGAG 
CTACCGCTGC AGGATCTGCT CGGCCCGGAT GCCGTGGCCC TGCGCGCCCG GCTCGAGGCT 
TCGGCGCTGG AGGGCATGGC CCGGCTGGCC TGCGACCTCT TCCTGCGGCC GAAGACCGCC 
CTTCCGCCCG GCGTCGCTCT GGCGATCACC GACTTCGTGG ATGCGCAGCT GCTGGCCCTG 
ATGGACGGCC GGCCTGCTCC GGCCCGGTGC CGCGTCCTGT CGGCCTTCCA CCGCGTGCGC 
GCGGCCGAAG AGATCATGCA TGCCCACAGC GAAGAGCCGC TCTCCATGCT CGATCTCGCA 
CGACGTCTGG ATATCGGCCT GCGCAGCCTG CAGCTGGCCT TCCGCGAGGT GCATGACGGC 
CTCTCGCCGC GCGAGGTCTA CAGCCGGATC CGGCTGGACC GCGCGCGGCA GCGGCTGCTG 
GCGGCTTCGG GGGCCGATCG GGTGACGACC ATCGCGCTCG ACAGCGGCTT CGGTCATCTC 
GGGCGGTTCG CCATGGCCTA TGCGCGCACC TTCGGCGAGT TGCCGAGTGA GACGCTTGCC 
CGCCGCCGCA GGATTTGA

Protein sequence

MPDGNASFRT QCFKGGDAAQ PLPSIMFAER RRLAILGENG FVETCVRTIE GSDIVFGSVR 
SSGHVIELRE PDRLTLLLPR AGRLRVRIGP AEHGVTPGCP MAFRPGERVT DATAGRDGLF 
AAITLQVPAA RVRALAEAAE LPLQDLLGPD AVALRARLEA SALEGMARLA CDLFLRPKTA 
LPPGVALAIT DFVDAQLLAL MDGRPAPARC RVLSAFHRVR AAEEIMHAHS EEPLSMLDLA 
RRLDIGLRSL QLAFREVHDG LSPREVYSRI RLDRARQRLL AASGADRVTT IALDSGFGHL 
GRFAMAYART FGELPSETLA RRRRI