Gene Rsph17029_1647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1647
Symbol
ID	4895409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	1739633
End bp	1741036
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	72%
IMG OID	640112240
Product	GntR family transcriptional regulator
Protein accession	YP_001043529
Protein GI	126462415
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.420905
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTGATA CAATATGGCA TCCTGACCTC GCACAATTTC CCGGCCCCAA ATATCTCGCC 
CTGACCCGGG CGCTGCGGGA GGCGATCCGC GAGGGGGTGC TGCTGCCGGG TGCGCAGCTT 
CCGACCGTGC GGGATCTGGC TTGGAGGCTG TCGGTGACGC CCGGCACCGT CTCGCGGGCC 
TATCAGATGG CCACGCAGGA GGGGCTTCTG GCCGCGACCG TGGGGCGGGG CACCTTCGTC 
GCGGCGGCCG AGCCTCGTCT CGGGCCGACG CAGGCCCTTT TCGTCGACCG CGAGCCGCAG 
GCCGCGCCGG GCCTTCTGGA TCTGCGCTCG CCGCAACTGC CGGACGTGGG GCAGATGCCG 
CTCTTCGCCG AGGCGCTGCG GCGGGTGGCG GGGCAGGTCG GCAACGACTG GCGCGATTAC 
CCCACACAGC GCGAGGAGAC GGCCCTGCGC GAGGCGGTGC GCGACTGGCT CGGCGACCGG 
GTGCTGGGGC CGGTCACGCC CGAGGACATT GCCCTCACCC ATGGCGGGCA GAGCGGCATC 
GGCCTCGTGA TGTTCTGCTG CCTTCGCGGC GACCGGCCCG TGGTGCTGAC CGAGGAGCTG 
GCCTATCCCG GTTTCCGTCA TGCGGCGCGG CTGGCGCGGG CCGAGGTGGT GGGCGTCGAG 
CTCGACCAGC ACGGGATCCG GCCGGATGCG CTGGAGGCCT GCTGCCGCAA GCATCTGCCG 
CAGGTGCTGT GCGTCACGAC GGAGGCGCAG AACCCGACCG CCGTGCGGAT GCCCGAGGAG 
CGCCGGGCCG AGATCGTGGC CATCGCCCGC CGGCACGAGC TCCAGATCAT CGAGGACGAT 
TGCTATACGG TGGCCGAAAG CACGCTGCCC TCGATGCGCG CGCTCGCGCC CGAGCGGACG 
TGGTATGTGG GCAGTCTCTC GAAGACCGTC TCGGCGGCGC TGCGCTTCGG CTATATCCTC 
TGCCCGACGG GCCGGGGCGA GGCGGGGCGC CTGACGGCGC AGCACGCGTT CTTCGCCCTG 
GGCCGGCCGG TCTCGGATCT CTGCCTGGAC CTCTTCCGCA GCGGTCAGGC CGTCGAGATC 
CGCAGTCGCG TCCAGAGCGC CTTCGCCGAC CGGCTGAAGG CCATCGTGAA CGGGCTCGGC 
GCGCACGATC TGGTCTGGCA GCCGGGGCTG CCCTTCGTCT GGCTGCGGCT GCCGGTGGGT 
TGGCGCACCT CCTCCTTCAC CCGCACCGCC GAAGCAGAGG GCGTGCTGCT GCGGTCGGCC 
GACGAGTATG CGCTGGTGCA CGGACGCTCG CCCAACGCCG TGCGGCTCGC CATCGCAGGC 
CAGGTGCCGC GCGCCCGGCT CGAGGCGGCG GTGGACCGGC TGTCGCGGCT GCTGGTCTCG 
CCACCGTCGG AACTGCCTGT GTGA

Protein sequence

MTDTIWHPDL AQFPGPKYLA LTRALREAIR EGVLLPGAQL PTVRDLAWRL SVTPGTVSRA 
YQMATQEGLL AATVGRGTFV AAAEPRLGPT QALFVDREPQ AAPGLLDLRS PQLPDVGQMP 
LFAEALRRVA GQVGNDWRDY PTQREETALR EAVRDWLGDR VLGPVTPEDI ALTHGGQSGI 
GLVMFCCLRG DRPVVLTEEL AYPGFRHAAR LARAEVVGVE LDQHGIRPDA LEACCRKHLP 
QVLCVTTEAQ NPTAVRMPEE RRAEIVAIAR RHELQIIEDD CYTVAESTLP SMRALAPERT 
WYVGSLSKTV SAALRFGYIL CPTGRGEAGR LTAQHAFFAL GRPVSDLCLD LFRSGQAVEI 
RSRVQSAFAD RLKAIVNGLG AHDLVWQPGL PFVWLRLPVG WRTSSFTRTA EAEGVLLRSA 
DEYALVHGRS PNAVRLAIAG QVPRARLEAA VDRLSRLLVS PPSELPV