Gene Nmar_0538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0538
Symbol
ID	5773620
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	478209
End bp	479225
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	37%
IMG OID	641316171
Product	galactose-1-phosphate uridylyltransferase
Protein accession	YP_001581872
Protein GI	161528046
COG category	[C] Energy production and conversion
COG ID	[COG1085] Galactose-1-phosphate uridylyltransferase
TIGRFAM ID	[TIGR00209] galactose-1-phosphate uridylyltransferase, family 1

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAGATA TGCGCAAAGA CTATGTTTCT GAGCGTTTCA TGATTGTCTC AAAAAAAGAA 
GACAAAGTAA AAGATCCAAA AAAATCTCCT TTTGCTCCTG GAAATGAATC TATGACAAAT 
CCTTCTGTAT TGTCTCTTGT TGCAAAAGAT GGAATGCTAC AAAGACTACA AGACAGTGAT 
GATGAATTTG TTGAAGGATG GTCAATCAGA GTTTTTGAAA GTAAAAATCC AATCGTCTCA 
GTTGATACTG AAAACTCTTA CAGTGATAGA CCATTTTACA GCGAACCTGC ATATGGATAT 
CATTACGTTG TTGTTGCATC TCCAAATCCA AAGGATACTT TTGCAACCAT TGACACTGAA 
CAATGGTCAA ACATCTTAGT AGTAGTTCAA GATAGATTGA GATGGCTTTA CACTCAAAAA 
GGTGTAACAT ATGTTTCAAT TTACGCTGAT CAAGGAGAAC TTTCTGGCAG TGCAAATTCT 
CACCCTCATC TCAATATTCT TACCTTTTCA ACAATCCCTC CTATTATTGA AGAAGAGGCA 
GAGGCATCTC ACAAAATTCT AAATGAAAAG GGTGTATGCC CAATGTGTCA GACTGTAAAT 
GAGGAAATTG GTGGTCCTAG GCAAGTTCTT CAAACTGAAG GTTTTATTGC ATTTTGCCCT 
TGGTCTCCAT CCTATCCATA TGAGTTTTGG ATTGCACCCA AGAAACACAC TACTAGCTTC 
TCAAAGATTA CTCAAAAAGA AATTAACGAT TTGTCCTTGA TACTTAGAGC TACTCTTGGT 
GGTTTGTCTC AAACTATCAA AAATGTGTCC TACAATCTAG TATTCCACCT TTCTCCTGAG 
AAAAAGAATA GTAGACAAAT TCATTGGCAT ATTGAAATTT ACCCAATCAC AAAATCTTGG 
TCTGGTTTGG AACGTGGTTA TGGAATTTTC TTAAATGATA TCTCTCCTGA AGAGGCTGCA 
GAAAAACTAG GTGCTGCTTG CAGAAAGGAA CTGGCTAATC TAGTTGGAAT TGTGTGA

Protein sequence

MGDMRKDYVS ERFMIVSKKE DKVKDPKKSP FAPGNESMTN PSVLSLVAKD GMLQRLQDSD 
DEFVEGWSIR VFESKNPIVS VDTENSYSDR PFYSEPAYGY HYVVVASPNP KDTFATIDTE 
QWSNILVVVQ DRLRWLYTQK GVTYVSIYAD QGELSGSANS HPHLNILTFS TIPPIIEEEA 
EASHKILNEK GVCPMCQTVN EEIGGPRQVL QTEGFIAFCP WSPSYPYEFW IAPKKHTTSF 
SKITQKEIND LSLILRATLG GLSQTIKNVS YNLVFHLSPE KKNSRQIHWH IEIYPITKSW 
SGLERGYGIF LNDISPEEAA EKLGAACRKE LANLVGIV