Gene Nmar_0125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0125
Symbol
ID	5774384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	114842
End bp	115831
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	26%
IMG OID	641315745
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_001581463
Protein GI	161527637
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.00000000000000332507
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAAAATTT TAGTTACAGG AGGATTAGGA TTTATTGGTA GTAATTTTAT AATTAATTAT 
TTAAACGAAT TCCCTGAACA TACCATAATT AATTTAGATA ATGAAAATCA TGGAGCCAAC 
CATCAAAATT TGATTTCAAT ACAAAAGAAA AATAATTATG AATTCGTTAA AGGAGATATC 
ACAAATCATA AACTAATGAA AAATTTGATT TCTATATCTG ATGCAATAGT AAATTTTGCA 
GCAGAATCCC ATGTTGATCG AAGTATTTCA GATGCAACAC CATTCATAAA CTCAAATATT 
TTAGGGGTAT TTACAATTCT AGAAATTTTA AAAAAAGAAA AAGAAAAAAG GTTAGTTCAG 
ATATCAACAG ATGAAGTTTT TGGAAGTTTA AAAAAAAATA GCGCAAATGA GAATTTCAAA 
TTAAATCCAT CCAGCCCATA TTCATCATCC AAAGCTTCAG CAGAATTGTT AGTTAATTCT 
TATTTTGTAA CATATGAAAT AGATACAGTA ATAACACGTT GTACTAATAA TTATGGACCT 
AGACAATTTC CTGAAAAATT AATACCAAAA ACTATTCTAT TAGCAATGCA AAAGCAAAAA 
ATTCCAATAT ACGGAAATGG GAAAAATATT AGAGATTGGA TTCATGTTGA TGATCATTGT 
AATGCAGTCA AAGAAGTTTT ACATAAAGGA AAATCTGGAG AATCATATAA CATTTCAGCC 
CAAAATGAAT TGGATAATAT TCAAATTGTT ACAAATATTT TGGAAAAAAT GGGATTGAAT 
GATGATTATT TAGAATTTGT AGAAGATAGA CCTGGGCATG ATTTTAGATA TAGTTTAGAT 
TCATCAAAAA TAAGAAATGA ATTAAAATGG AAAGAAGAAA CAAGCTTTGA AGATGGAATT 
GAAAAAACAA TTGATTGGTA TGTTAAAAAT CAAGAATGGT GTAACGGTAT TAATAAAGAG 
ATTTTAAAAA AAGCCAAATG GAATAACTAA

Protein sequence

MKILVTGGLG FIGSNFIINY LNEFPEHTII NLDNENHGAN HQNLISIQKK NNYEFVKGDI 
TNHKLMKNLI SISDAIVNFA AESHVDRSIS DATPFINSNI LGVFTILEIL KKEKEKRLVQ 
ISTDEVFGSL KKNSANENFK LNPSSPYSSS KASAELLVNS YFVTYEIDTV ITRCTNNYGP 
RQFPEKLIPK TILLAMQKQK IPIYGNGKNI RDWIHVDDHC NAVKEVLHKG KSGESYNISA 
QNELDNIQIV TNILEKMGLN DDYLEFVEDR PGHDFRYSLD SSKIRNELKW KEETSFEDGI 
EKTIDWYVKN QEWCNGINKE ILKKAKWNN