Gene Nmar_1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1037
Symbol
ID	5773689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	910852
End bp	912618
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	33%
IMG OID	641316679
Product	DNA ligase I, ATP-dependent Dnl1
Protein accession	YP_001582371
Protein GI	161528545
COG category	[L] Replication, recombination and repair
COG ID	[COG1793] ATP-dependent DNA ligase
TIGRFAM ID	[TIGR00574] DNA ligase I, ATP-dependent (dnl1)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTTTT CTATCTTAGC TGATTCGTTT AACAAGATGG AATCAACTAG AAAAAGATTA 
GAACTAACAC AGTACTTGGT AGAATTATTT AAAAAAACTC CACAAGAAGT GATTTCAAAG 
ATAGTCTATT TACTTCAAGG AAAACTAAGA CCAGACTTTG AAGGAGTGGA GTTGGGAGTT 
GCAGAAAAAC TTGCAATAAG AGCAATCTCA AAATCTTCAG GAATACCAAT TAAAAAAATT 
GAAGAAGAAT ACAGAAAAGG TGGAGACTTG GGGCATGCAG CCACTACAAT TCTAGAGCAA 
AAAACGCAGA CAACATTTCT CGTAGAAGAC ATTACAGTTG AACGAGTCTA TGAGACATTA 
TTCAAGATTG CAAAGTTAGA GGGCAATAGA TCACAAGACA TGAAGATGAA ATACATTTCA 
AGCTTACTTA ATGATGCAAG TCCGTTAGAG GCAAGCTTTA TTCTAAAAAT ATTGTTAGGT 
ACACTAAGAC TAGGAATTGC AGAAAATACT GTAATGGATG CATTAGCATT AGCATTTTCA 
GGCAACAAAG AAAATAGAAA AATTTTGGAG CATGCATACA ATGTTTCTAG TGATTTGGGA 
AAAGTTGCAG AAGTTTTAGC AACTGAAGGA TTAGCAGAAG TTGAAAAATT CAAAATAATT 
TTGTTTAATC CAATCAGACC AATGCTTGCA GACAGAGTAA AGAGCGAACA AGAAGCAATT 
GAAAAAATGG GGAATGAATT TGCAGCTGAA TACAAATTAG ATGGAGAAAG AGTACAACTA 
CACATAGAAG GAGACAAAGT AGTTTTATTT TCAAGAAGTT TAGAAAATAT TTCAAGTTAT 
TATCCAGATA TTATAGAAAA AATTCCAAAA ACAATTCAAG CAGAAAATAT TGTACTAGAG 
GCAGAAGCAG TAGCAATCAA TGAAAACACA GGAGAGTTTT TGCCATTTCA AGAATTAATG 
CATAGAAGAA GAAAATACAA AATAGAAAAA GCAGTTACAC AATATCCCAT AACGGTAAAT 
CTCTTTGATA TCTTGTATTG TAATGGAAAG AGTTGTCTTG AATTAGACTA TAAAGAAAGA 
AGAGAAAAAA TGGAAAAAGT GGTAAAAGAA GATGATTTTG TAAAGCACAT TCCCATGGCC 
ATTGTCAAAA ATGAAAATGA TATTGAAGAC TTTTTTGAAA ACAGCATCAA TGCAGGAAGT 
GAAGGACTAA TGCTAAAGAC GCTTGTTAGT CCATATCAAG CAGGTTCAAG AGGAAGTCAC 
TGGTTAAAAC TGAAAAGAGA ATATCAAAAT GAACTTGGAG ATAGTTTAGA TCTTGTTGTG 
ATAGGAGGAT TCTTTGGGAA AGGAAGACGG ACAGGAAACT ATGGAACTTT ATTGTTAGCA 
ACATACGAAG AAGATGAAGA TACATTCACC AGCATTTGTA AAGTTGGAAC AGGTTTTTCA 
GATGAAGATT TAGATCAATT ATATCAAATT CTAAATCCCA AAGTAACAAT CAAGAAAAAT 
CCGCGTATTA ATAGTGAAAT GGAAGCAGAT GTTTGGTTTG AACCAGAATT AGTAATAGAG 
GTGGTTGCAT CAGAGATTAC ACTTAGTCCA ATTCACAAAG CAGCTAGAGA CAAAATTAGA 
AAGGGAGCAG GACTTGCATT GAGATTTCCA AAATTTACAG GAAAGATGAG AGTTGAAAAA 
ATGGCAGAAG ATGCATCTAC TAATGAAGAA GTGATCACAT TATACCAAGG TCAGAAAAAA 
GTGGCACATG ACAAAAGTCT CATGTAA

Protein sequence

MEFSILADSF NKMESTRKRL ELTQYLVELF KKTPQEVISK IVYLLQGKLR PDFEGVELGV 
AEKLAIRAIS KSSGIPIKKI EEEYRKGGDL GHAATTILEQ KTQTTFLVED ITVERVYETL 
FKIAKLEGNR SQDMKMKYIS SLLNDASPLE ASFILKILLG TLRLGIAENT VMDALALAFS 
GNKENRKILE HAYNVSSDLG KVAEVLATEG LAEVEKFKII LFNPIRPMLA DRVKSEQEAI 
EKMGNEFAAE YKLDGERVQL HIEGDKVVLF SRSLENISSY YPDIIEKIPK TIQAENIVLE 
AEAVAINENT GEFLPFQELM HRRRKYKIEK AVTQYPITVN LFDILYCNGK SCLELDYKER 
REKMEKVVKE DDFVKHIPMA IVKNENDIED FFENSINAGS EGLMLKTLVS PYQAGSRGSH 
WLKLKREYQN ELGDSLDLVV IGGFFGKGRR TGNYGTLLLA TYEEDEDTFT SICKVGTGFS 
DEDLDQLYQI LNPKVTIKKN PRINSEMEAD VWFEPELVIE VVASEITLSP IHKAARDKIR 
KGAGLALRFP KFTGKMRVEK MAEDASTNEE VITLYQGQKK VAHDKSLM