Gene Nmar_0846 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0846
Symbol
ID	5774218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	745994
End bp	747136
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	35%
IMG OID	641316484
Product	phosphoribosylaminoimidazole carboxylase, ATPase subunit
Protein accession	YP_001582180
Protein GI	161528354
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0000154723
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACCAAAA TTTTAGGGAT CATAGGCGGA GGACAGCTTG GCATGATGAT AGCAGAGGCT 
GCCAAAAAGA TGCCTGAAAA TGTTTCAAAA ATCATAGTAT TGGATCCTAC AGAGAATTGT 
CCTGCAGCTC AAGTAGGTGC AGAACAAATT GTTGCAGATT TCAAAGACAA AAATGCCATA 
ATTGAACTCT CAGAAAAATC AGACATTATT ACATATGAAA TTGAATCAGG AGATAGCGAA 
GTCTTAAAAT CCGTTGAAAA AAATGCAGAG ATTAACCCTT CTCCTGAAAC ATTACATACA 
ATTCAAGACA AATTCTTACA AAAAACATTT CTTAAAGAAC ACGGTATCCC TGTTCCAGAG 
TTTATAGAAA TTTCAAACAT TGATGATGTT AAAGAGGGAT TGAAAAAATT TGGATATCCT 
GCATTGCTCA AAGCAAGACG TGATGCATAT GATGGACGAG GAAACTTTAA GGTAGACTCT 
GAAGACATGG TCCAAACAGC ATATGATTAT TTCAAAGATC AAAAATTGAT GTTAGAAAAA 
TTTGTGCCAT TCAAAATGGA AGTATCTGTA ATTGCAGCTA GAAACACTAA AGGCGAAATC 
AAAACATTTC CTCTTGTAGA AAATATTCAT GAAGAAAATA TTTTGCGCGA AACAATTGCT 
CCTGCAAGAG TTTCTGAAGA AATAACAAAG AATGCCGAAA AAATTGCCAG TCAAACTATG 
GACGTACTAA AAGGTGCAGG AGTGTTTGGA ATTGAAATGT TTGTAACTCG AGATGATCAG 
ATTGTAATTA ACGAAATTGC TCCTAGAGTT CACAATTCAG GACACCATAC TTTGGAATCT 
AGTGAAACAT CACAGTTTGA ACAACATTTG CGTGCAATTT TAGGATTAGA TCTTGGAAGT 
ACCAAACTTT TACGTCCTAC CATAATGTAC AATATACTTG GAACAAAAAC CTTTGAGGGA 
GAATACAAGC CATTAGAAAT CCCCGAAGAA AATCTATTTC TCAAAATGTA TGGAAAGAAA 
ATTTCTAAAC CCATGAGAAA ACTAGGTCAT TTTAATCTGA TATCTACAAA CAATGAATCA 
GTTGAAGATC TATTGAAGAA ATTGGAATCC ATAAAACCTA GGGCAGCAGT TCAATCTATC 
TGA

Protein sequence

MTKILGIIGG GQLGMMIAEA AKKMPENVSK IIVLDPTENC PAAQVGAEQI VADFKDKNAI 
IELSEKSDII TYEIESGDSE VLKSVEKNAE INPSPETLHT IQDKFLQKTF LKEHGIPVPE 
FIEISNIDDV KEGLKKFGYP ALLKARRDAY DGRGNFKVDS EDMVQTAYDY FKDQKLMLEK 
FVPFKMEVSV IAARNTKGEI KTFPLVENIH EENILRETIA PARVSEEITK NAEKIASQTM 
DVLKGAGVFG IEMFVTRDDQ IVINEIAPRV HNSGHHTLES SETSQFEQHL RAILGLDLGS 
TKLLRPTIMY NILGTKTFEG EYKPLEIPEE NLFLKMYGKK ISKPMRKLGH FNLISTNNES 
VEDLLKKLES IKPRAAVQSI