Gene Nmar_0124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0124
Symbol
ID	5774359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	113741
End bp	114796
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	27%
IMG OID	641315744
Product	glucose-1-phosphate thymidyltransferase
Protein accession	YP_001581462
Protein GI	161527636
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1209] dTDP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR01208] glucose-1-phosphate thymidylylransferase, long form

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.00000000000000322504
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAAAGGAA TAATTTTACA TGGTGGTCAT GGAACACGAC TAAGGCCTTT AACCCATACA 
GGACCAAAAC AACTACTTCC AATTGCAAAT AAACCAATGT CTCAATACTG TATTGAATCC 
ATGAAGAATG CAGGGATTAC AGAAATTGCC ATCATTATTG GAGGTATAGC TTCTAAAAAA 
GTCGAAGAAT ATTATGGAAA TGGAGAGAAA TTTGGAGTAA AAATCACGTA TATTTCACAA 
GAAGCGCCAA AAGGTATTGC TCATGCAATA AATCTATGCA AAGATTTTGT TAAAGATGAT 
AAATTCCTTG TATTTTTAGG AGACAATATT TTAAAAAAAG AAATTTTGGA ATACAAAACC 
AATTATGAAA ATTCTGATGC AGATGCACTA TTGTTATTAT GTGAAGTAGA TAACCCTACA 
CAATTTGGAA TTGCAGATGT TAAAGATAAT AAAATTATCA AGATCATGGA AAAACCAAAG 
GATCCACCAA CAAATCTTGC AGTTACAGGA ATTTATTTTC TAAATAAAAA AATTTTTGAA 
ATTATTGATA TCTTAAAACC TTCATGGAGA AACGAGTTAG AGATTACTGA TGCACTACAA 
TTATTGATGG AAAAAGGAAA TAAAATTATC TTTGACACTG TAACTGATTA TTGGAAAGAT 
ACAGGAACTC CAAATGATAT TTTACATGCA AATAAAGAAA TTCTTCAAGA TATTTCTCAA 
GAATTTTTGG GAGAAAAAGA ACAAACTCAA ATTGATGGTG TTTGTGTTTT AAAAGAAAAA 
TCATTGCTAA AAAATGTAAA AATAATTGGA CCAGTCTTAA TTGGAAAAAA TTGTATTATT 
AATAATAATT CAGTTATTGG TCCTAATGTT AGTATTGGAG ATAATTGTAA AATTTCAAAA 
AGTAAAATTG AGAATTCAAT AATTATGAAT AATTGTGAAA TTAATTCAAA TATAAAAATT 
TCAGATAGTA TAATTGCTTT TGATTGTCAG ATTTTTCAAG AAAAAAATGA AAAGAATGTT 
TTGCTTCTAG GTGAAGGAAC AAAAATTTGG ATTTAA

Protein sequence

MKGIILHGGH GTRLRPLTHT GPKQLLPIAN KPMSQYCIES MKNAGITEIA IIIGGIASKK 
VEEYYGNGEK FGVKITYISQ EAPKGIAHAI NLCKDFVKDD KFLVFLGDNI LKKEILEYKT 
NYENSDADAL LLLCEVDNPT QFGIADVKDN KIIKIMEKPK DPPTNLAVTG IYFLNKKIFE 
IIDILKPSWR NELEITDALQ LLMEKGNKII FDTVTDYWKD TGTPNDILHA NKEILQDISQ 
EFLGEKEQTQ IDGVCVLKEK SLLKNVKIIG PVLIGKNCII NNNSVIGPNV SIGDNCKISK 
SKIENSIIMN NCEINSNIKI SDSIIAFDCQ IFQEKNEKNV LLLGEGTKIW I