Gene Nmar_0140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0140
Symbol
ID	5774448
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	129568
End bp	130626
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	29%
IMG OID	641315760
Product	pyruvate carboxyltransferase
Protein accession	YP_001581478
Protein GI	161527652
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.00000000000000672144
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGTCCAAAA AAGTTCAAAT CCTTGACACT ACATTACGAG ATGGCAGTTA TTCTGTGAAT 
TTTTCATTTA CTAGTTCTGA TACATCTATA ATCTGTTCTA AATTGGAAAA ATCTGGAATT 
AAATTAATTG AAGTTGGTCA TGGACTTGGG TTTAATGCTT CTAACTCTGG TTATGGAAAA 
TCTACACAAT CTGATGAAGA ATATATGATT GCTGCAAAAG AGTCTTTATC AAAATCAATG 
TATGGAATGT TTTGTATTCC TGGAATTGCT AAACTATCTG ATTTAGAACT TGCTAAAAAA 
CATGGTATGG GATTTATTCG AGTAGGTACC GATGTTACCA AAGTACATCA ATCTGAAAAA 
TTTATCAAAA AAGCAAAAAA TCTTGGATTT TTTGTGGCCT CAAATTTTAT GAAATCTTAT 
GTAATGCCAC CTGATAAATT TGCATCAATT GTTAAACAAT CTGAAGAATT TGGAACTGAT 
ATGGTGTATA TTGTGGATTC TGCTGGAGGT ATGTTTTCTT CAGATTTGTT AGAATATTAT 
AATTCAATAA GAAACGTATC TGAAATTCCA CTTGGTTTTC ATGGTCATGA TAATTTAGGT 
ATGGCAATTT CAAACAGTCT GTATGCTGCT GATTTAGGTA TGGAATACAT AGATTCTTCT 
CTTCAGGGAA TTGGAAGAAG TTCTGGAAAT GCTTGTACTG AAGTTTTAGT TATGGCATTG 
AAGAAAAAAG GATTCAAGAT AGATGTTGAT TTTCATAGTC TCTTTGAAGC AGGACAAGAA 
TGTGTTTACC CATTAATCAA TAATTCTAAT AAATTACCCC TTGATATTGT TTCAGGTTAT 
GCTGATTTTC ATTCAAGTTA TATGCATCAT ATAATGAAAT ATTCTTCCAA GTTTAAAGTT 
GATCCATTAT TATTGATTAT AGAATATTCT AAAATTAATA AAATTGATAT TGATGAAAAA 
AAATTAGAAC AAATTGCTAA AAAATTAAAG AGAAAACAGG ATATTTACAC TGCAAAATAC 
AGATTTAACA GATATGTCGG AAGAGAACAA GATAATTAA

Protein sequence

MSKKVQILDT TLRDGSYSVN FSFTSSDTSI ICSKLEKSGI KLIEVGHGLG FNASNSGYGK 
STQSDEEYMI AAKESLSKSM YGMFCIPGIA KLSDLELAKK HGMGFIRVGT DVTKVHQSEK 
FIKKAKNLGF FVASNFMKSY VMPPDKFASI VKQSEEFGTD MVYIVDSAGG MFSSDLLEYY 
NSIRNVSEIP LGFHGHDNLG MAISNSLYAA DLGMEYIDSS LQGIGRSSGN ACTEVLVMAL 
KKKGFKIDVD FHSLFEAGQE CVYPLINNSN KLPLDIVSGY ADFHSSYMHH IMKYSSKFKV 
DPLLLIIEYS KINKIDIDEK KLEQIAKKLK RKQDIYTAKY RFNRYVGREQ DN