Gene Rsph17029_0501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0501
Symbol
ID	4897468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	523928
End bp	525007
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	66%
IMG OID	640111085
Product	putative GTP cyclohydrolase
Protein accession	YP_001042389
Protein GI	126461275
COG category	[S] Function unknown
COG ID	[COG1469] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.291801
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATCC TGACGCCCGT GGCCGAGCGC CTGCCGAGCC GTGAGGAAGC CGAAGAGGCA 
CTGGCCGTGC TCCGCCGCTG GGCGACGCAT ACGCCGGCCT CCGATGTGGC CGCGCTCGCG 
CCCGAGGCCC CGGCGCTGGT CTATCCCGAC CTCAGCCGCG CCTATCCCCG CACCTTCACG 
GTGGACGAGG CCTACAAGGC CTCGCTGCCC GACCTGCAGA ACGGGCCCGC CAGCCTGATC 
GTCGGCGCGA AGGCCGTGAT CCAGCATGTC GGCATCTCGA ACTTCCGCCT GCCGATCCGC 
TATCACACGC GCGACAACGG CGATCTGCAG CTCGAAACCT CCGTCACCGG CACGGTGAGC 
CTCGAGGCCG AGAAGAAGGG CATCAACATG AGCCGCATCA TGCGGTCCTT CTATGCCCAT 
GCCGAGCAGG CCTTCAGCTT CGAGGTGATC GAGCGCGCGC TCGAGGATTA CAAGCGCGAC 
CTCGAGAGTT TCGACGCCCG CATCCAGATG CGCTTCTCCT TCCCGGTGAA GGTGCCGTCG 
CTGCGGTCGG GCCTCACAGG CTGGCAATAT TACGACATCG CGCTCGAGCT GGTTGACCGC 
GGCGGGGTGC GCAAGGAGAT CATGCATCTC GACTTCGTCT ATTCCTCGAC CTGCCCCTGC 
TCGCTGGAGC TGTCCGAACA TGCCCGGCGC GAGCGCGGGC AGCTGGCCAC GCCGCATTCG 
CAGCGGTCGG TCGCGCGGAT CTCGGTCGAG GTGCGGCAGG GCAAGTGCCT CTGGTTCGAG 
GATCTTCTGG ATCTCGTCCG CAGCGCGGTG CCGACCGAGA CGCAGGTCAT GGTCAAGCGC 
GAGGACGAGC AGGCCTTCGC CGAGCTGAAT GCCGCAAACC CGATCTTCGT CGAGGATGCC 
GCGCGCAGCT TCTGTCAGGC GCTGCAGTCC GATCCGCGGA TCGGCGACTT CCGCGTGGTG 
GCGAGCCATC AGGAATCGCT GCATTCCCAC GATGCGGTCT CGGTTCTGAC CGAGGGGCCG 
ACATTCGCGG CCGAAAGTCT CGATCCGAGG CTCTTTTCCA GCCTCTACCA CGTCGGCTGA

Protein sequence

MNILTPVAER LPSREEAEEA LAVLRRWATH TPASDVAALA PEAPALVYPD LSRAYPRTFT 
VDEAYKASLP DLQNGPASLI VGAKAVIQHV GISNFRLPIR YHTRDNGDLQ LETSVTGTVS 
LEAEKKGINM SRIMRSFYAH AEQAFSFEVI ERALEDYKRD LESFDARIQM RFSFPVKVPS 
LRSGLTGWQY YDIALELVDR GGVRKEIMHL DFVYSSTCPC SLELSEHARR ERGQLATPHS 
QRSVARISVE VRQGKCLWFE DLLDLVRSAV PTETQVMVKR EDEQAFAELN AANPIFVEDA 
ARSFCQALQS DPRIGDFRVV ASHQESLHSH DAVSVLTEGP TFAAESLDPR LFSSLYHVG