Gene Dshi_1225 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1225
Symbol
ID	5711783
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	1267586
End bp	1269130
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	72%
IMG OID	641267137
Product	deoxyribodipyrimidine photo-lyase
Protein accession	YP_001532568
Protein GI	159043774
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.474608
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.333965
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGATC CCGCCCCCAT CCTTGTCTGG TTCAAGCGCG ACCTGCGCGT GGCCGATCAC 
CCGGCGCTGG CGCGGGCGGC CGCACTTGGG CCTGTCCTGC CGGTTTACAT CGTGGAGCCG 
GAGTATTGGC AGCTTCGGGA CGTCTCGGCG CGGCAGTGGG CGTTCACGCG GGAATGTGTG 
GCGGACCTGT CGCGGGAGCT TGCGGCGCTG GGCGCGCCCT TGCGGATCGA GACCGGAGAG 
GCGGTCGCGG TGCTGGAGCG GCTGCGCGCC GCGCACGGGA TCACCCTGAT GATCAGCCAT 
GAGGAGATCG GCAATGGCTG GACCTATGCC CGCGACCGGG CAGTGGCCGA TTGGGCGCGG 
GCGCAGGGCG TGGCCTGGGA GGAGTTGGCG CAATCCGGGG TCGTGCGGCG GCTGAACGGG 
CGGGACGGCT GGGCGCGTAC GCGGGACCGG TTCATGGCAC AGCCGCAGGT GGCGGTGCCC 
GTGCTGCGCG GTGTCGACGG CGGGGGCGGG GCCTTGCCCG ATGCGGCCGC GCTGGGCCTT 
GCCGACGATC CCTGCCCGGG GCGGCAGCGC GGCGGGCGGG ATGAGGCCTT GTCCCTGTTG 
GGCGGGTTTC TGACCGAGCG GGGCCGGACC TACCGCGCGG CGATGGCCAA TCCGCTGGAC 
GGGGCGGAAG CGTGCTCGCG CCTGTCGCCG CACCTGGCGC TCGGCACCCT GTCGGGGCGG 
GAGGCGGTTC AGGCGGCGGC AATGCGCAAG GCCGAGGTGA AGGGCACGCG GGACGGCTGG 
ATCGGGGCGA TGAAGAGCTT CGAGGCGCGG CTCGCCTGGC GCGATCACTT CATGCAGAAG 
CTGGAGGATG CGCCGCGGCT GGAGCATGCG TGCCTCCATT CGGCTTATGA GGGGTTGCGG 
CCCGCGGTGC CGGACCCGGT GCGGCTGGGG GCCTGGGCCA AGGGGGAGAC GGGATTGCCC 
TTCGTCGATG CCTGCATGCG GTCGCTGATC GCCACGGGGT GGCTGAATTT TCGGGCGCGC 
GCGATGCTGG TGGCGGTGGC GTCCTATCAC CTGTGGCTGG ATTGGCGCGC CTCCGGCACG 
ATCCTGGGGC GGTATTTCAC CGATTTCGAG CCGGGGATTC ACTGGCCGCA GGTGCAGATG 
CAGTCGGGCA CCACGGGGAT GAACACGGTG CGGATCTACA ACCCGGTCAA GCAGGGGCAT 
GACAACGACC CCGAGGGCGT GTTCACCCGC CGCTGGCTGC CGGAACTGGC GGAAGTTCCG 
GACCGGTACC TGCAGGAGCC CTGGCGCTGG GAGGGGGCGG ACAGCGTGCT GAACCGGACC 
TATCCCGCGC CGATCGTGGA GCCCAAGGCC GCGGCGGCAG CGGCCCGCGA CAAGGTCTGG 
GCCGTGCGGC GCGGAGAGGC GTTTCGCAGC GAGGCCGCCC GGGTGGTCGA AAAGCACGCC 
AGCCGGAAGG ACGCGCAGGG GCGGTTCGTC AATGACCGCG CCCCGCGCAA GACCCGCCGC 
CGGGCGCCGA AGGCCCCGCC GGGGCAGATG AGCCTCGACC TGTGA

Protein sequence

MTDPAPILVW FKRDLRVADH PALARAAALG PVLPVYIVEP EYWQLRDVSA RQWAFTRECV 
ADLSRELAAL GAPLRIETGE AVAVLERLRA AHGITLMISH EEIGNGWTYA RDRAVADWAR 
AQGVAWEELA QSGVVRRLNG RDGWARTRDR FMAQPQVAVP VLRGVDGGGG ALPDAAALGL 
ADDPCPGRQR GGRDEALSLL GGFLTERGRT YRAAMANPLD GAEACSRLSP HLALGTLSGR 
EAVQAAAMRK AEVKGTRDGW IGAMKSFEAR LAWRDHFMQK LEDAPRLEHA CLHSAYEGLR 
PAVPDPVRLG AWAKGETGLP FVDACMRSLI ATGWLNFRAR AMLVAVASYH LWLDWRASGT 
ILGRYFTDFE PGIHWPQVQM QSGTTGMNTV RIYNPVKQGH DNDPEGVFTR RWLPELAEVP 
DRYLQEPWRW EGADSVLNRT YPAPIVEPKA AAAAARDKVW AVRRGEAFRS EAARVVEKHA 
SRKDAQGRFV NDRAPRKTRR RAPKAPPGQM SLDL