Gene Rsph17025_2914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_2914
Symbol
ID	5084514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	2971860
End bp	2972951
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	73%
IMG OID	640484485
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_001169105
Protein GI	146278946
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.118782
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.174393
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCACC CGCTCACCTT CCTCGGCATC GAGAGCAGCT GCGACGACAC CGCGGCGGCC 
GTGGTGCGCG CGGCCGAGCG GGCCGAGATC CTGTCCTCGG TGGTGGACGG GCAGGCCGCG 
CTGCACGCGC CCTTCGGCGG CGTGGTGCCG GAAATCGCGG CCCGCGCCCA TGCCGAGCGG 
CTCGACCTCT GCGTCGAACG CGCGCTGCAG GAGGCCGGGC TGGGTCTTGG CGATCTCGAC 
GGGATCGCGG TGACGGCGGG GCCGGGCCTG ATCGGGGGCG TGCTGTCGGG CGTGATGCTG 
GCCAAGGGGC TGGCGGCGGG AACGGGCCTG CCGCTCGTGG GGGTGAATCA CCTCGCGGGC 
CACGCGCTCA CACCACGGCT GACCGACGCG CTTGCCTTTC CCTATCTGAT GCTTCTCGTG 
TCGGGAGGTC ATTGCCAGTT CCTGATCGCT CGTGGAGCGG AAGCGTTTTC GCGCCTTGGC 
GGTTCCATCG ACGATGCGCC GGGCGAGGCT TTCGACAAGA CCGCCAAGCT TCTGGGCCTG 
CCGCAACCCG GAGGCCCCTC GGTCGAGGCC GAGGCGGCCA CGGGCGATCC GCGCCGCTTC 
GCCTTTCCGC GGCCGATGCT GGACCGGCCG GGGTGCGACA TGTCCTTTTC GGGGCTGAAG 
ACCGCGCTGC TCCGGGCCCG CGACGGGATC GTGGCGGAGA AGGGCGGGAT CACGCGGCAG 
GATCGGGCCG ATCTCTGCGC GGGCTTTCAG GCGGCCGTGG TGGATGTGCT GGCGGAAAAG 
ACCCGCCGCG CGCTCGCGAT CTATGCGGAG GAACAGGCGC CCGTGCCCGC GCTGGCGGTG 
GCCGGCGGGG TGGCGGCCAA CGGGCCGATC CGCGCGGCGC TGACCCGCGT GGCCGAGGAG 
GCGGGCGCGC GCTTCCTCGC CCCGCCGCTG CGGCTCTGCA CGGACAATGC CGCCATGATC 
GCCTGGGCGG GCATCGAGAG GTTTCGGGCG GGCGGCCGCG ACGGGATGGA TCTGCAGGCC 
CGTCCGCGCT GGCCGCTCGA CCAGAGCGCG CCGGCCCTGA TCGGGTCGGG CAGGAAGGGG 
GCAAAGGCAT GA

Protein sequence

MSHPLTFLGI ESSCDDTAAA VVRAAERAEI LSSVVDGQAA LHAPFGGVVP EIAARAHAER 
LDLCVERALQ EAGLGLGDLD GIAVTAGPGL IGGVLSGVML AKGLAAGTGL PLVGVNHLAG 
HALTPRLTDA LAFPYLMLLV SGGHCQFLIA RGAEAFSRLG GSIDDAPGEA FDKTAKLLGL 
PQPGGPSVEA EAATGDPRRF AFPRPMLDRP GCDMSFSGLK TALLRARDGI VAEKGGITRQ 
DRADLCAGFQ AAVVDVLAEK TRRALAIYAE EQAPVPALAV AGGVAANGPI RAALTRVAEE 
AGARFLAPPL RLCTDNAAMI AWAGIERFRA GGRDGMDLQA RPRWPLDQSA PALIGSGRKG 
AKA