Gene Nmar_1066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1066
Symbol
ID	5773668
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	938826
End bp	940112
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	36%
IMG OID	641316708
Product	aspartyl-tRNA synthetase
Protein accession	YP_001582400
Protein GI	161528574
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0017] Aspartyl/asparaginyl-tRNA synthetases
TIGRFAM ID	[TIGR00458] aspartyl-tRNA synthetase, archaeal type

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTATTTG TAAAAACTCA CGATATTTCA GAACTCACAT CAGAGTTAAT TGGAAAGCAA 
GTTGTTTTGG GAGGATGGAT TGAGGATTTA AGAAAGTTGG GAAAGATGTC ATTTATCACG 
TTACGTGATG TGTCTGGAAT TTCCCAAGTT ATTGTAAAGG GCGAGTTAAA TGATAATCTT 
GGAGAGATTA ATCGCCAAAG TGTTGTAAGT GTAAAAGGAA TTGTTCAGGA AACTAAAGCA 
AGAGACTTTG CATTTGAAAT TAAAGCTGAA GAAATTGAAG TGTTAGGAAA AGCAATTCAT 
CCATTACCAG TTGATCCAAT TGGAAGAGTA GAAAGTAACA TTGACACAAG ATTGAATCAT 
CGTGCACTAG ACATGAGAAA TCAAAAAACA GCATCGATTT TCAAATTAAG ACATTATGTT 
TTGCAATCAT TAAGAAAGAC ATTAGTTGGA AAAAAATTCA TTGAAATCAC CACACCGAAA 
ATTATTGGCA GTGCAAGTGA AGGCGGAGCA AATCTCTTTT CATTAGAATA TTTTGGAAAG 
AAAGCATACT TGGCACAGAG TCCACAATTA TACAAAGAAC AGATGACAAT AGGATTAGAA 
AGAGTGTTTG AGATTTCAAA CTTTTATCGA GCAGAAAACT CTCATACCGG AAGACATCTT 
AGTGAATTTA CTAGTATAGA TATCGAAGCA GCATTCATGG ATTACAATGA TGTCATGGAT 
GTTTTAGAGT CACTGGTTAT GGACGTGTAC AAGTTTACAT CAGAAAATTG TAAAAAAGAA 
CAAGAGATAA TCGGCCACAC TATAGAGGTT CCAAAATCAC CATTTGAGAG AATCACATAC 
AATCAGTGTA TTGAGGAACT AAAGAGTGCA GGAGAAAAGG TGGAATTTGG AGATGATTTG 
CTCGATTCAC ATCTTAGAAT CATAGGAAAC AATCATCCAG GATTCTTCTT TTTGACTGAC 
TGGCCTATGA AACTAAAACC ATTTTACATT AGAGAGAAAG ATGAAGACCC AGAACTATCA 
CGCTCATTTG ACTTGCAATA TGGATATCTA GAGTTGTCCT CAGGTGGAAC AAGGCTTCAC 
AATCCAGAGA GGTTAAAGAA CAGATTAAGA GAGCAAGATT TGGATCCTGC ACAATTTACT 
GACCATCTCA AGGCATTTGA TTGGGGAATG CCTCCACATT CGGGATGGGG AATGGGGTTA 
GACAGGTTGA TGACTACATT GATTGGAATT GATAATGTCC GTGAAGTTGT CTTGTATCCA 
AGAGATCCTG ACAGATTAAG TCCATAG

Protein sequence

MVFVKTHDIS ELTSELIGKQ VVLGGWIEDL RKLGKMSFIT LRDVSGISQV IVKGELNDNL 
GEINRQSVVS VKGIVQETKA RDFAFEIKAE EIEVLGKAIH PLPVDPIGRV ESNIDTRLNH 
RALDMRNQKT ASIFKLRHYV LQSLRKTLVG KKFIEITTPK IIGSASEGGA NLFSLEYFGK 
KAYLAQSPQL YKEQMTIGLE RVFEISNFYR AENSHTGRHL SEFTSIDIEA AFMDYNDVMD 
VLESLVMDVY KFTSENCKKE QEIIGHTIEV PKSPFERITY NQCIEELKSA GEKVEFGDDL 
LDSHLRIIGN NHPGFFFLTD WPMKLKPFYI REKDEDPELS RSFDLQYGYL ELSSGGTRLH 
NPERLKNRLR EQDLDPAQFT DHLKAFDWGM PPHSGWGMGL DRLMTTLIGI DNVREVVLYP 
RDPDRLSP