Gene RSP_2232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_2232
Symbol
ID	3719762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	849420
End bp	850844
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	72%
IMG OID	640070405
Product	putative uracil-DNA glycosylase
Protein accession	YP_352289
Protein GI	77462785
COG category	[L] Replication, recombination and repair
COG ID	[COG1573] Uracil-DNA glycosylase
TIGRFAM ID	[TIGR00758] uracil-DNA glycosylase, family 4

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCGGCCT GGCGCGCCGA GGCCCGGCGG CTGGCGCAGG CGGGTGTTCC GGCGGAAAGC 
GTCGTCTGGC GCGTGGGCGC GGGCGAAGCC GACCTTTTTG CCGACCTGCC CGCCCTGCCC 
GCGGGCCCGG CGCGCCAGAT CCGGCTGTCG CGCGAGGCGG TCGGCTCATT GGAAACTGCC 
CTCTGCCACG CCGATCCCGA GCGGTTCGGC CGTGCCTACG GTCTTCTCCT GCGGCTGGCG 
GACGGCACTT TGCGCTGGGG CGACCGGAGC GATCCCGCGC TGCGCAAGCT CCTTGCGCAG 
GAGAAGATGG TTCGGCGCGA GATCCACAAG ATGCACGCCT TCGTCCGCTT CCGCGAGCTT 
CCCTCGGAGG GCCCCCGCCG CGCCTTCGCG GCCTGGTTCG AGCCGGACCA TCCGGTCGAG 
GAGGCGGCGA CGCCCTTCTT CGCCCGCCGG TTCGGCGACA TGGACTGGGC CATCGTCACG 
CCCGAGGTTA CCGCGCGGTT CGTGGCAGGG CAGCTCGATT TCGCCCTGAC CGAGGAGCGC 
ACCGCGCCAC CCGCCGATGG AACGGAAGAG CTGTGGCGGA CCTATTACGC CAACATCTTC 
AATCCGGCGC GGCTGATGGT GAAGGCGATG CAGTCCGAGA TGCCGAAACG CTACTGGAAG 
AACCTGCCCG AGGCGGAGCT GATTCCGGGC CTGATCCGGG GTGCGGCCGA ACGGGCGGCC 
GAGATGCAGG CCGCAGCGCC GACCGAGCCG CCCGCGCGAA CGGCGGCCGT GGCGCGGCAG 
CGTGCGGCGG CGGCCGGCGG ACCGGCTGCG GCCGGCGACG GCTCAGCGCC CGGCACGTTG 
GCCGAAGCGA AGACCGCGGC CGAAGGATGC CGGCGCTGCG GCCTCTGGGC CAATGCCACG 
CAGGTCGTGT TCGGGGAAGG ACCCGCCACG GCGCGCATGA TGATCGTGGG CGAGCAGCCG 
GGGGATCGCG AGGATCTGGC CGGCCGGCCC TTCGTGGGCC CTGCAGGACA GCTCTTCGAT 
GAGGAGGCGG CAGCGGCCGG CCTCGATCGC GGATCGGTCT ATGTCACCAA TGCGGTCAAG 
CACTTCAAGT TCGCCCCACG CGGCAAGCGC CGCATCCACC AGAAGCCCGA TGCGGGCGAG 
GTGACCGCCT GCCGCTGGTG GCTCGATCTC GAGCGGGATC TGGTGCGCCC CCGCCTGATC 
GTCGCGATGG GCGCAACGGC GCTCGCCTCG CTCACCGGCT CGGGGGCGGG GATCCTGAAG 
CGGCGCGGGT CGGTCGAGAG GCTCGACGAC GGGACGCCGG TCTTCGTGAC GGTCCATCCC 
TCCTACATCC TGCGCCTGCC GGACGAGGCC GCGCGCGTCG AGGAGCGCAG GCGGTTCCGG 
GACGATCTTC AGGCGGCCCG ACAGCTGCTG GAGCGTCTGG ACTGA

Protein sequence

MAAWRAEARR LAQAGVPAES VVWRVGAGEA DLFADLPALP AGPARQIRLS REAVGSLETA 
LCHADPERFG RAYGLLLRLA DGTLRWGDRS DPALRKLLAQ EKMVRREIHK MHAFVRFREL 
PSEGPRRAFA AWFEPDHPVE EAATPFFARR FGDMDWAIVT PEVTARFVAG QLDFALTEER 
TAPPADGTEE LWRTYYANIF NPARLMVKAM QSEMPKRYWK NLPEAELIPG LIRGAAERAA 
EMQAAAPTEP PARTAAVARQ RAAAAGGPAA AGDGSAPGTL AEAKTAAEGC RRCGLWANAT 
QVVFGEGPAT ARMMIVGEQP GDREDLAGRP FVGPAGQLFD EEAAAAGLDR GSVYVTNAVK 
HFKFAPRGKR RIHQKPDAGE VTACRWWLDL ERDLVRPRLI VAMGATALAS LTGSGAGILK 
RRGSVERLDD GTPVFVTVHP SYILRLPDEA ARVEERRRFR DDLQAARQLL ERLD