Gene Daro_3894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3894
Symbol
ID	3567739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	4184272
End bp	4185684
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	60%
IMG OID	637682368
Product	deoxyribodipyrimidine photo-lyase type I
Protein accession	YP_287092
Protein GI	71909505
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	68
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAG AAAAAGCCTT GGTCTGGTTC CGCCGCGACT TGCGCGACCA TGACCACGCC 
GCCCTGAGCG CGGCCCTCGC CGAGGCGCAG CAGGTGTATT GCGCCTTTGT CTTCGATAGC 
GAAATTCTCG ATCCGCTGCC AACACGCCAT GATCGCCGGG TGCACTTCAT CCGCGAATCG 
CTGGTCGAAC TGGATGCCGC CTTGCGAGCC AGGGGTGGCG GGCTGATCAT TCGGCACGGC 
CAGGCCGTCG ACGAGATTCC TGCTCTCGCC AGGCGGCTTG GCGTATCTGC CGTCTTCACC 
AACCGGGATT ACGAACCCTC GGCGAAACGC CGCGATGCCC AGGTTGCCCG GCAACTTCGG 
AACGACGACA TTGCCTTTCA CGGTGTCAAG GATCAGGCCA TTTTCGATGG CGACGAAGTA 
TTAACCCAGG CGGGAAAAGC CTTTTCTGTT TTTACCCCCT ACAAGAATGC CTGGCTAAAA 
CGCCTGACCA CCGCTGATTA CGCTGCCTGG CCCTGTGATG GGCGATTGGC CGGCCAGGAA 
CTGGCAGGCA TTCCAACGCT GGAAGAGATT GGCTTTACTC CGACCGACTT GGCCGAACTC 
GGCATCCAGC CGGGCATGTC AGGCGCCAAA GGGCTGTGGG ACGATTTCTC CCGGGACCGC 
ATCGAGCGCT ATGGCAGCCT GCGCGACTTT CCTGCCGTCA AGGGCGTCTC CTACCTGTCC 
GTCCATCTAC GCTTCGGGAC CATCTCGATC CGCCAACTGG TCAGGCAGGC ATTGGCACAT 
CAGGCTGACA CCTGGCTCAG CGAGTTGATC TGGCGCGACT TCTATTTCAT GATCCTCGAC 
CATTTTCCCC ACGTCGCCGG ACACGCCTTC AAGCCGGAAT ACGATGCAAT TCAATGGGCA 
AGCCGTCCTG AAGCCTTTGC AGCCTGGTGC GAAGGTTGCA CCGGCTACCC GCTAGTCGAT 
GCGGCCATGC GCCAACTCAA TTTCAGCGGC TGGATGCACA ATCGGCTCCG CATGGTCGTC 
GCCTCCTTCC TGACCAAGGA TCTCGGCATC GACTGGCGGC TCGGCGAAAA ATACTTTGCC 
GAGCAACTCA ACGACTTCGA TCTGTCTGCC AACAACGGCG GCTGGCAGTG GGCCTCATCG 
AGCGGCTGCG ATGCCCAGCC CTATTTTCGG ATTTTCAACC CGGTCACGCA GTCGGAAAAG 
TTCGATGCGG AGGGCAAATT CATCCGCCGT TATGTGCCGG AACTGGCCAA GGTACACGAT 
AAATACATCC ATGCCCCGTG GAAAATGGGG CGCATCGAAC AGGAAGCACT CGGGGTGGTG 
ATCGGACGCG ACTACCCGTC GCCGATCGTC GATCACGCAA CGGCCAGGGA TGAAACCCTG 
GCCCGCTACG CAGTCGTCAA GAAGCAGGCC TAA

Protein sequence

MKKEKALVWF RRDLRDHDHA ALSAALAEAQ QVYCAFVFDS EILDPLPTRH DRRVHFIRES 
LVELDAALRA RGGGLIIRHG QAVDEIPALA RRLGVSAVFT NRDYEPSAKR RDAQVARQLR 
NDDIAFHGVK DQAIFDGDEV LTQAGKAFSV FTPYKNAWLK RLTTADYAAW PCDGRLAGQE 
LAGIPTLEEI GFTPTDLAEL GIQPGMSGAK GLWDDFSRDR IERYGSLRDF PAVKGVSYLS 
VHLRFGTISI RQLVRQALAH QADTWLSELI WRDFYFMILD HFPHVAGHAF KPEYDAIQWA 
SRPEAFAAWC EGCTGYPLVD AAMRQLNFSG WMHNRLRMVV ASFLTKDLGI DWRLGEKYFA 
EQLNDFDLSA NNGGWQWASS SGCDAQPYFR IFNPVTQSEK FDAEGKFIRR YVPELAKVHD 
KYIHAPWKMG RIEQEALGVV IGRDYPSPIV DHATARDETL ARYAVVKKQA