Gene Rsph17029_2442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2442
Symbol
ID	4895219
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	2576852
End bp	2577871
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	67%
IMG OID	640113040
Product	endonuclease/exonuclease/phosphatase
Protein accession	YP_001044316
Protein GI	126463202
COG category	[R] General function prediction only
COG ID	[COG2374] Predicted extracellular nuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.23952
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00360154
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGCCCGCC CGCTGCGCAT CGCCACCTAC AATGTCGAAT GGTTCAACGG GCTCTTCGAC 
GACCACGGGC GGCTCAGGAC CGACAACGAA CTGTCGGGCC GCTACGAGAT CACCCGCCGC 
AACCAGATCG AATCGCTGGG CATCGTCTTC ACCGCCCTCG ATGCCGACGC GATCATGGTC 
ATCGAGGCGC CGAACCAGAG CCGGCGCCGC TCGACGGTGA AGGCGCTCGA GACCTTCGCG 
CGCACCTTCG GCCTGCGCGC CTCGCACGCC GTCATGGGCT TTCCGAGTGA GACCGAGCAG 
GAGATCGCGC TCCTCTACGA CCCCTCGCGC ATCGAGGCCC ATCACGATCC GCAGTCGAGC 
GCCAAGGCGC CTAGGTTCGA CGATGTGTTC CGCTTCGACA TCGACGTGGA TGCCACGCCC 
GAGGCCATCC GCTTCTCCAA GCCGCCGCTC GAGCTTGCGC TCAGGGCCGA CGGCCATCCG 
CTGCGGGTGA TCGGCGTCCA TGCCAAGTCC AAGGCCCCGC ACGGCGCGCG CAACCCGGCC 
GAGGCGGTGC GGATCGGCAT TCAGAACCGC CGTCAGCAGC TGGCCGAATG CGTCTGGCTG 
CGCCGGCGGG TGGCGGGCCT CCTCGCGCGG CACCAGAGCG TGATGGTGAT GGGCGATTTC 
AACGACGGCC CCGGTCTCGA CGAATATGAG AAGCTCTTCG GCCGGTCGGG GATCGAGATC 
GTCCTCGGGC TCGAGGAGCC TCCCGAGTTG CGCCTGCACG AGCCCCATGC GCGCATGGCG 
CTCACGCAGA AGGTGGGCAT CCAGCCCAGC TCGGCCCGCT TCTGGCTCGC CCCGGAACAG 
CAGTATTTCG AGGCCCTGCT CGACTTCATC ATGGTCTCGG CCGATCTGGC GGCGAAATCG 
CCCCGCTGGC GGATCTGGCA TCCGCTGAAC GACCCGAACT GCTTTCGCAC CCCCGAGTTG 
CAGCAGGCCC TCCTCGCGGC CTCGGACCAT TTTCCGGTCA CGCTCGACAT CGACCTCTGA

Protein sequence

MARPLRIATY NVEWFNGLFD DHGRLRTDNE LSGRYEITRR NQIESLGIVF TALDADAIMV 
IEAPNQSRRR STVKALETFA RTFGLRASHA VMGFPSETEQ EIALLYDPSR IEAHHDPQSS 
AKAPRFDDVF RFDIDVDATP EAIRFSKPPL ELALRADGHP LRVIGVHAKS KAPHGARNPA 
EAVRIGIQNR RQQLAECVWL RRRVAGLLAR HQSVMVMGDF NDGPGLDEYE KLFGRSGIEI 
VLGLEEPPEL RLHEPHARMA LTQKVGIQPS SARFWLAPEQ QYFEALLDFI MVSADLAAKS 
PRWRIWHPLN DPNCFRTPEL QQALLAASDH FPVTLDIDL