Gene Rsph17029_0817 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0817
Symbol
ID	4896480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	828341
End bp	829756
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	73%
IMG OID	640111401
Product	deoxyribodipyrimidine photo-lyase
Protein accession	YP_001042700
Protein GI	126461586
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGCCG ACGCTCCCCT GATCCTGTGG TTCCGGCGCG ACCTGCGGCT GGCCGACAAT 
CCGATGCTGG CAGAGGCGGC GGCCACGGGC CGGCCGCTGA TCCCGCTGTT CATCCTGGAT 
CCCGAGACCG AGGCGCTGGG CGCCGCGCCG AAATGGCGGC TGGGTCTCGG GGTCGAGGCC 
TTCGCTCAGG CGCTGGAAGG ACTGGGCAGC CGGCTCGTGC TGCGGCGGGG GCCGGCGCTC 
GCCGTGCTCA AGACGCTGGT GGCCGAGACC GGGGCTGCGG GGGTGCACTG GTCGCGGCTC 
TGGGAGCCGG ACTGGCGGGC GCGCGACGAG GGGGTGACGG CGGGGCTCCG GCAGGCGGGC 
ATCGAGGCCG CGCGCCATGC CGGCCACACG ATCTTCGAGC CCCGGGAGGT GGAGACCGGG 
CAGGGCGGCT TCTACCGGGT CTATACGCCG TTCTGGAAAG CGGTGAAGGA CCGCCCGGTC 
GCGGCCTCCT TCCCGCCGCC CGCGCGGCTG CCGTCTCCCG CGGAGTGGCC GGTCTCCGAG 
CGACTGGCCT CTTGGGATCT CGGGCGGGCG ATGAACCGGG GCGCGGCCGT GGTGGCGCCG 
CATCTGGCGG TGGGCGAGGC GGCGGCGGCC GAACGGCTGG CGCGGTTCCT GAGCGGGCCG 
CTCGACCGCT ATGCCGCGGA GCGCGACCGG CCGGATGCGC CCGTGACCTC GCGCCTGTCG 
GAAAACCTCA CCTATGGCGA GATCTCGGCC CGCAGCCTCT GGCACGCCGG CATGCGCGCC 
CGTGCGGAGG GGCGGGCGGG GGCCGAGAAG TTCCTCCAGG AGCTCGCCTG GCGCGAGTTC 
GGCTGGCATC TGCTCTACCA CACGCCCGAG ATCGCGCGCC GCAACTGGCG CGGCGACTGG 
GATGCCTTTC CCTGGCGCGG CGACAATCCC GACGCCGAAC GCTGGCGGCG CGGCATGACC 
GGCGAGCCCT TCGTCGATGC GGCCATGCGC GAGCTGTTCG TGACCGGCAC CATGCACAAC 
CGCGCGCGGC TGATCGCGGG CAGTTACCTT ACGAAGCATC TGCTGACCGA CTGGCGCGTG 
GGCAAGGCCT GGTTCGAGGA CTGCCTGATC GACTGGGACC CGGCGTCGAA CGCGCTCGGC 
TGGCAGTGGG TCGCGGGGTC GGGGCCCGAT GCCTCGCCCT ATTTCCGCAT CTTCAACCCC 
GCGACCCAGG CCGAGAAGTT CGATCCCGAG AGTGCCTATC GCCGGAGGTT CCTTGCTGAA 
ATCGCGCGCA GGCCCGGCCC CGAGGCGCTT GCCTTCTTCG AGGCGGTGCC GCGAAGCTGG 
GGCCTTCGGC CCGATCGATG CTACCCTCGG CCCGTCGTGG GGCTGGCGGA GGGGCGGGAG 
CGGGCACTGG CCGCCTACGG GCGGCGCAAC AACTGA

Protein sequence

MMADAPLILW FRRDLRLADN PMLAEAAATG RPLIPLFILD PETEALGAAP KWRLGLGVEA 
FAQALEGLGS RLVLRRGPAL AVLKTLVAET GAAGVHWSRL WEPDWRARDE GVTAGLRQAG 
IEAARHAGHT IFEPREVETG QGGFYRVYTP FWKAVKDRPV AASFPPPARL PSPAEWPVSE 
RLASWDLGRA MNRGAAVVAP HLAVGEAAAA ERLARFLSGP LDRYAAERDR PDAPVTSRLS 
ENLTYGEISA RSLWHAGMRA RAEGRAGAEK FLQELAWREF GWHLLYHTPE IARRNWRGDW 
DAFPWRGDNP DAERWRRGMT GEPFVDAAMR ELFVTGTMHN RARLIAGSYL TKHLLTDWRV 
GKAWFEDCLI DWDPASNALG WQWVAGSGPD ASPYFRIFNP ATQAEKFDPE SAYRRRFLAE 
IARRPGPEAL AFFEAVPRSW GLRPDRCYPR PVVGLAEGRE RALAAYGRRN N