Gene Namu_4704 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4704
Symbol
ID	8450334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5233089
End bp	5234468
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	73%
IMG OID	645043744
Product	Deoxyribodipyrimidine photo-lyase
Protein accession	YP_003203969
Protein GI	258654813
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.940834
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCGA CCAGCCTGCT CTGGTTCCGC CGCGACCTGC GGTTGGGCGA CCACCCGGCG 
TTGGCCGCCG CCGCCGACCA CAACCACCGT GTGCTGGGGG TTTTCGTCGC CGACGACGTG 
CCCCTGGACG CCTCCGGCTC GCCCCGGCGG GCCGTGCTGG CCCGGACCCT GGCCGCCCTG 
GCGCAGGCCA TGGACGGTCG GCTGCTCATC GCCCACGGGC GCCCGCGGTC GGTGCTGCCC 
CGGCTGGCCC GGGCGGTGGA CGCGGACGTC GTGCACGTCT CGGCCGATTA CGGGCCGTAC 
GGGCGGCGGC GGGACGAGCA GGTGCAGCGG GCCCTGCAGG ATGCCGGCGT CGAGTGGGTG 
GCCACCGGCT CGCCCTACGC GGTGGCCCCC GGGCGCGTGC GCAAGAGCAA CGGCGAGCGG 
TACGCGGTGT TCACGCCCTT CTACCGGGGC TGGACCGACC ACGGGTGGCG CAAGCCCGCC 
CGGTCCGGGT CCGGGGTCGA CTGGGTCGAC CCGGGCGAGG TCGACGGGAT CACTGCCCAC 
GACCCGCAGG AGTACGCCCG CACGGTGCCG GCCGGCATGT CGTTGCCGGA GGTGGGCGAG 
CAGGCCGCGC TCGATGGCTG GCGCACCTTC CGGGACGAGG CCCTGGACGA CTACGACGGC 
GACCGGGACC GCCCGGATCG CCCTGGCACC AGCCACATGT CGGTGTACCT GAAGTGGGGC 
TCGATCCATC CGCGCACCCT GCTGGCCGAT CTGGCCGGCC GCCGCTCGAC TGGCGCGGCC 
AGCTACCGGC GCGAGCTGGC CTGGCGGGAG TTCTACGCGG ACAGCGTCTT TCATCTGCCC 
GAGTCGGTCT GGACCTCGGT GGACCCGGTG ATCGACCGGA TGGCCTGGGA TTCCGGCCAG 
CCGGCCGAGG AACGCTTCGA GGCGTGGCGG GCCGGGCGGA CCGGCTACCC GTTCATCGAT 
GCCGGGATGC GTCAGCTGCT GGCCGAGGGC TGGATGCACA ACCGCCTGCG GATGGCCACC 
GCCTCGTTCC TGATCAAGGA CCTGCACCTG CCCTGGCAGC GCGGCGCCGA GCACTTCCTG 
GAGCACCTGG TGGACGGCGA CTACGCGTCG AACAATCACG GCTGGCAGTG GGTGGCCGGA 
TCGGGCGCCC AGGCGGCGCC GTTCTTCCGC ATCTTCAACC CGCTCACCCA GGGCGAGAAG 
TTCGACCCGT CAGGGGATTT CGTCCGCCGG TACATTCCCG AACTACGGGA CGTGCCGGGT 
CGCAAGGTGC ACCGGCCGTG GGAGCTGGAC GGCGGGGTCC CCGCCGGCTA CCCGGAGCCG 
ATCGTCGATC ACGCCGACGA GCGGGCCGAG GCCCTGCGCC GCTGGCAGCA GCGCGGCTGA

Protein sequence

MTSTSLLWFR RDLRLGDHPA LAAAADHNHR VLGVFVADDV PLDASGSPRR AVLARTLAAL 
AQAMDGRLLI AHGRPRSVLP RLARAVDADV VHVSADYGPY GRRRDEQVQR ALQDAGVEWV 
ATGSPYAVAP GRVRKSNGER YAVFTPFYRG WTDHGWRKPA RSGSGVDWVD PGEVDGITAH 
DPQEYARTVP AGMSLPEVGE QAALDGWRTF RDEALDDYDG DRDRPDRPGT SHMSVYLKWG 
SIHPRTLLAD LAGRRSTGAA SYRRELAWRE FYADSVFHLP ESVWTSVDPV IDRMAWDSGQ 
PAEERFEAWR AGRTGYPFID AGMRQLLAEG WMHNRLRMAT ASFLIKDLHL PWQRGAEHFL 
EHLVDGDYAS NNHGWQWVAG SGAQAAPFFR IFNPLTQGEK FDPSGDFVRR YIPELRDVPG 
RKVHRPWELD GGVPAGYPEP IVDHADERAE ALRRWQQRG