Gene RPD_3098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3098
Symbol
ID	4023602
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3441798
End bp	3443261
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	68%
IMG OID	637963298
Product	deoxyribodipyrimidine photolyase
Protein accession	YP_570225
Protein GI	91977566
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.383524
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0341678
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAACA ACACGCCCCG CCCCGTCATC GTTTGGTTTC GCGACGATCT GCGGCTGTCC 
GATCACCCTG CCCTGCATCA AGCTGCCGCA TCCGGCGGAC CGCTGATCTG CATCTACGTC 
TTCGACGAAG ACAGCGCGCA GCTCCGCTCG CCGCAGGCCA GACCGCTCGG CGGCGCATCG 
CGCTGGTGGC TGGCGCAATC GCTGCGCGCG CTCGCTGCCA GTTTGGAGAA GCGCGGCGCG 
CGGCTGATCC TGCGCCGCGG ACCGGCCGCC GCGATCATCG CCGAGCTGGC GCGCCAGGTC 
GACGCCAGCG CGGTGCACTG GAACGAGATC GAGATCGCGC CGCATCGCGC GGTCGCCGAC 
GACCTCGCCG AAGCGTTGAG CGTCGCCGGG ATCGATCACC ACCGCCATCG CGGCGATCTG 
CTCGCTTCGC CAGCGGAGGT GCGCACCAAA GAAGGCCGCG GACTGCGCGT GTTCACGCCG 
TTCTGGCGAC GCGTGCTCGG CCTTGGCGAT CCGCCGAAGC TGCTGCCGGC GCCGAAAACC 
CTGAGTGCCG CGCAAGGTCC GTCCGGCGAT CAGCTTGATA GCTGGATGCT CGAGCCGACC 
GAACCGGACT GGGCCGGCGG CCTGCGCGAA AGCTGGACGC CCGGCGAAGG CGCCGCGCAA 
GACAACCTCA CCGCATTCCT CGACGCCCTG CCCGGCTACA CCGAAGGCCG CGACCGGCCC 
GACTGCGCTG CGACGTCGCG GCTGTCGCCG CATCTGCGGT TCGGCGAGAT CAGCCCGCGT 
CAGGTCTGGT ACGCGGCGCG GTTCGCCGCG GCGGAGCGGC CCGCGATCGC CGGCGACATC 
GACAAGTTCC TGAGCGAACT CGGCTGGCGC GAGTTCTGCC GGCATTTGCT GCACGATCAT 
CCCGATCTCG CCGAGCGCAA TCTGCAGGCC TCATTCGACG CCTTTCCCTG GATCACCGAC 
GCCGCCGCGC TGCACGCCTG GCAGCGCGGC TGCACCGGTT ATCCGATCGT CGATGCGGGA 
ATGCGCGAGC TCTGGCACAC CGGCGTGATG CACAATCGCG TCCGCATGGT GGTGGCGTCG 
TTCCTGGTGA AGCATCTGCT GATCGACTGG CGCTGCGGCG AGCAATGGTT CTGGGACACG 
CTGGTCGACG CCGATGCCGG CAGCAATCCG GCCAATTGGC AGTGGGTCGC GGGCTCCGGC 
GCCGATGCCG CGCCGTATTT TCGCGTGTTC AATCCCATCC TGCAGGGAGA AAAATTCGAC 
CCGGCCGGCG ACTATGTGCG TCGCTGGGTG CCTGAACTCG CCTCGCTTCC CGCTAAATTC 
ATCCACCAGC CATGGACTGC GACGCCGTTC GAACTCGCAG CGGCGGGCGT CACACTCGGC 
GGCAATTATC CGGAGCCGAT CATCGATCAC CGGGTCGGAC GCGAGCGCGC GCTTGCGGCT 
TACGCCAAAA CGCGTCAGCA TTGA

Protein sequence

MPNNTPRPVI VWFRDDLRLS DHPALHQAAA SGGPLICIYV FDEDSAQLRS PQARPLGGAS 
RWWLAQSLRA LAASLEKRGA RLILRRGPAA AIIAELARQV DASAVHWNEI EIAPHRAVAD 
DLAEALSVAG IDHHRHRGDL LASPAEVRTK EGRGLRVFTP FWRRVLGLGD PPKLLPAPKT 
LSAAQGPSGD QLDSWMLEPT EPDWAGGLRE SWTPGEGAAQ DNLTAFLDAL PGYTEGRDRP 
DCAATSRLSP HLRFGEISPR QVWYAARFAA AERPAIAGDI DKFLSELGWR EFCRHLLHDH 
PDLAERNLQA SFDAFPWITD AAALHAWQRG CTGYPIVDAG MRELWHTGVM HNRVRMVVAS 
FLVKHLLIDW RCGEQWFWDT LVDADAGSNP ANWQWVAGSG ADAAPYFRVF NPILQGEKFD 
PAGDYVRRWV PELASLPAKF IHQPWTATPF ELAAAGVTLG GNYPEPIIDH RVGRERALAA 
YAKTRQH