Gene Rsph17029_3804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3804
Symbol
ID	4898416
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	934056
End bp	935582
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	70%
IMG OID	640114408
Product	deoxyribodipyrimidine photolyase-related protein
Protein accession	YP_001045656
Protein GI	126464543
COG category	[R] General function prediction only
COG ID	[COG3046] Uncharacterized protein related to deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.206805
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACACGGC TCATCCTCGT GCTGGGCGAC CAGCTCAGCG ACGATCTTCG GGCGCTCCGG 
GCGGCGGATC CGGCCGCAGA TCTCGTGGTC ATGGCCGAGG TGATGGAGGA GGGCACCTAT 
GTGCCGCACC ATCCGCAGAA GATCGCCCTG ATCCTCGCCG CCATGCGCAA GTTCGCCCGC 
CGCCTGCAGG AACGCGGCTT CCGCGTGGCC TATTCCCGGC TGGACGATCC CGAGACCGGG 
CCCTCGATCG GCGCCGAGCT CCTGCGGCGG GCCGCAGAGA CCGGGGCCCG CGAGGCGGTC 
GCCACCCGGC CCGGCGACTG GCGGCTGATC GAAGCGCTCG AGGCCCTGCC CCTGCCCGTC 
CGCTTCCTGC CCGACGACCG TTTCCTCTGC CCGGCAGACG AGTTCGCCCG CTGGGCCGAG 
GGGCGCAAGC AGCTGCGCAT GGAGTGGTTC TATCGCGAGA TGCGCCGCAG GACCGGCCTC 
CTGATGGAGG GGGACGAGCC CGCGGGCGGG AAGTGGAACT TCGACACAGA GAACCGCAAG 
CCCGCGGCGC CCGACCTGCT GCGTCCGCGG CCGCTGCGCT TCGAGCCCGA TGCCGAGGTG 
CGCGCAGTCC TCGATCTCGT CGAGGCGCGC TTTCCGCGCC ATTTCGGGCG GCTCCGCCCG 
TTCCACTGGC CCACCGACCG GGCCGAGGCG CTGCGGGCGC TCGATCACTT CATCCGCGAA 
AGCCTGCCGC GCTTCGGCGA CGAGCAGGAT GCGATGCTGG CCGACGATCC GTTCCTGAGC 
CATGCGCTGC TGTCCTCGTC GATGAACCTC GGGCTTCTCG GGCCGATGGA GGTTTGCCGC 
CGCGCCGAGA CCGAATGGCG CGAGGGCCGC GCGCCGCTGA ACGCGGTCGA GGGCTTCATC 
CGGCAGATCC TCGGCTGGCG GGAATATGTG CGGGGGATCT GGGCGCTCTC GGGGCCGGAC 
TACATGCGCT CGAACGGGCT CGGCCACAGC GCCGCCCTGC CGCCACTCTA CTGGGGCAAG 
CCCACGCAGA TGGCCTGCCT CTCGGCCGCG GTCGCCCAGA CCCGCGATCT CGCCTATGCC 
CACCACATCC AGCGACTGAT GGTGACGGGC AATTTTGCGC TGCTGGCGGG TGTCGATCCC 
GCCGAGGTGC ACGAATGGTA TCTCTCGGTC TATATCGATG CGCTGGAATG GGTCGAGGCG 
CCGAACACGA TCGGGATGAG CCAGTTCGCC GATCACGGGC TCCTCGGCTC GAAACCCTAT 
GTCTCGTCCG GCGCCTATAT CGACCGGATG TCGGATTACT GCCGCGGCTG CGCCTATGCG 
GTGAAGGACC GGACGGGGCC CCGCGCCTGC CCCTTCAACC TGCTCTACTG GCACTTCCTG 
AACCGGCACC GCGCGCGGTT CGAGCGCAAC CCCCGCATGG TCCAGATGTA TCGCACCTGG 
GACCGGATGG AGGAGACCCA TCGCTCGCGG GTTCTGACCG AGGCAGAGGC CTTCCTCGGC 
CGGCTCCACG CGGGCGAGCC GGTCTGA

Protein sequence

MTRLILVLGD QLSDDLRALR AADPAADLVV MAEVMEEGTY VPHHPQKIAL ILAAMRKFAR 
RLQERGFRVA YSRLDDPETG PSIGAELLRR AAETGAREAV ATRPGDWRLI EALEALPLPV 
RFLPDDRFLC PADEFARWAE GRKQLRMEWF YREMRRRTGL LMEGDEPAGG KWNFDTENRK 
PAAPDLLRPR PLRFEPDAEV RAVLDLVEAR FPRHFGRLRP FHWPTDRAEA LRALDHFIRE 
SLPRFGDEQD AMLADDPFLS HALLSSSMNL GLLGPMEVCR RAETEWREGR APLNAVEGFI 
RQILGWREYV RGIWALSGPD YMRSNGLGHS AALPPLYWGK PTQMACLSAA VAQTRDLAYA 
HHIQRLMVTG NFALLAGVDP AEVHEWYLSV YIDALEWVEA PNTIGMSQFA DHGLLGSKPY 
VSSGAYIDRM SDYCRGCAYA VKDRTGPRAC PFNLLYWHFL NRHRARFERN PRMVQMYRTW 
DRMEETHRSR VLTEAEAFLG RLHAGEPV