Gene Nther_2139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_2139
Symbol
ID	6314798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	+
Start bp	2260956
End bp	2262326
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	37%
IMG OID	642644526
Product	Deoxyribodipyrimidine photo-lyase
Protein accession	YP_001918293
Protein GI	188586748
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID	[TIGR00591] photolyase PhrII

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCATA AAGAAAGAAT AGAAATCCTC CAAGAAGTAC AAACACCAGC TCAAGAAGGA 
AAATACGTAC TCTACTGGAT GCAAAAAGCA CAACGAACTC ATTACAATCA TGCACTTGAA 
TATGCTATCG AACAGGCCAA CAAGCTCAAC TTACCCCTGA TCGTTTATTT TGGCTTGTAC 
GAACAATTTC CTTATGCTAG TTCAAGACAT TTTCAGTTCA TGCTTCAAGG ATTACAGGAT 
GTCGCCGAAA ACTTGGCGAA AAGAAATATC AAAATGATTA TAAAGAGAAC TTTTCCTCCT 
TATGGGGCAA TTGAATTAGC AAAAGATGCT TCTATGATTG TAGTTGACAA GGGGTATCTT 
AAATTTGAAA AGGACTGGAA AGAAATACTC TCACATCAGT TAAGCTGTCC TATTCACCAA 
ATTGAAACCG ACGCCGTTAT ACCGGTGAAT ACAGCCTCTT CGAAAGAAGA GTATGCTGCC 
TATACATTGC GAAAAAAGCT CTTAAAAATG CTTGACATTT TCCTCACTCC TTTGATTTCA 
AGGAATCCAA ATTTTAATTC CTTTGAGATA ACAAATCTAG AACAATATAA TGATATAGAT 
ATTTATACTA AAAGTGCTTC CGAAATTCTA GAGGAATTAG ACATCCATCG AGAAGTACAA 
CCCGTAACAG ATATTAAAGG AGGAGAAAAT CAAGCTCTAG AACAATTATC CGGGTTTTTG 
AACCAAGGAA AAGGTTTGGA GCTCTATATT CAAAAAAAGA ATGACCCTAG TGTTCAGGCC 
ACTTCAAAAT TAAGCCCTTA TTTACATTTT GGCCAAATTT CACCTTTATT TATCGCACTA 
GAAGTACTTA AATTTACCCA AGATTATAAT CATGAATTTC TAGAACAATT AATAGTCAGA 
AGAGAGTTGA GCCTTAACCT GATTGAGAAA AATATTAATT ATCTTACTTT ATCACCACTG 
CCTCAGTGGT CTATAAAAAC TCTAAATGAA CACCGCAATG ACCCGCGAAA TAACTTTTAT 
ACCTTAGAAG AAATAGAAGC CGCTAACACA CATGATAAAT ACTTTAATGC AGCCCAAAAA 
GAACTTATGT CCAGGGGAAC AATTCATAAT TATATCCGTA TGTACTGGGG GAAAAAGATC 
ATAGAGTGGT CCCAAACGCC AGAAGAAGCT CATAATACCC TCTGTCACTT GAATGACAAA 
TATGCCCTAG ACGGTCGTGA TCCCAATGGT TACGCCAATA TATTATGGTG TTTTGGCAAA 
CACGACCGAC CATTCCAAGA GAGGCAAATT TTTGGGAAAG TAAGGTATAT GGGAGTTAAT 
GCATTAAAGA GAAATGGCAA ACCTGACCAA TATGTGGCTA CTTGGGTCTA G

Protein sequence

MIHKERIEIL QEVQTPAQEG KYVLYWMQKA QRTHYNHALE YAIEQANKLN LPLIVYFGLY 
EQFPYASSRH FQFMLQGLQD VAENLAKRNI KMIIKRTFPP YGAIELAKDA SMIVVDKGYL 
KFEKDWKEIL SHQLSCPIHQ IETDAVIPVN TASSKEEYAA YTLRKKLLKM LDIFLTPLIS 
RNPNFNSFEI TNLEQYNDID IYTKSASEIL EELDIHREVQ PVTDIKGGEN QALEQLSGFL 
NQGKGLELYI QKKNDPSVQA TSKLSPYLHF GQISPLFIAL EVLKFTQDYN HEFLEQLIVR 
RELSLNLIEK NINYLTLSPL PQWSIKTLNE HRNDPRNNFY TLEEIEAANT HDKYFNAAQK 
ELMSRGTIHN YIRMYWGKKI IEWSQTPEEA HNTLCHLNDK YALDGRDPNG YANILWCFGK 
HDRPFQERQI FGKVRYMGVN ALKRNGKPDQ YVATWV