Gene Nmar_1490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1490
Symbol
ID	5773245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	1358772
End bp	1359884
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	38%
IMG OID	641317138
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_001582824
Protein GI	161528998
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.624592
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGCTG ACGATTTTGT TGTGACTCCT TGGCACGTAG AAGGAGATAT CGATTATGAC 
AAGTTAATCA AGCAATTTGG CACTCAAAAG ATTTCTCCAG AACTGCTAGC ACGAATCCAA 
AAAATTACTG GAGAGGATCA TTTCATGCTC AGACGTGGAA TCTTTTTCTC TCACAGAGAG 
ATGAACAGAA TTTTAGATGA TTATGAGAAA GGCAACAAGT TCTTCCTATA CACAGGACGA 
GGTCCATCAG GCCACACCCA CATTGGCCAC CTGGTTCCAT GGGTCTTTGC AAAATGGCTC 
CAAGAAAAAT TTGATGTAAA CATGTATTTT CAATTAACAG ATGATGAGAA ATTTTTCTCA 
AAACCAAATC TAACTTTGGA GGAGACAAAA AACTTTGCAT ATGAAAATGC TCTTGACTTT 
ATTGCACTAG GTTTCAAACC AGAAAAAACA AAGATCATCA TCAACACAAG AAACATCCAA 
ACGCTTTATC CAATTGCAGC TCAAGTTGCA AAGAAGATCA ATTTCTCAAA TACTAAAGCA 
ACATTTGGAT TTACAAATGA AACCAACCTC GGAATGATAT TTTACACATC ACTCCAGTCT 
GCTCCATGTT TCATAGAAGA CAAGCCAGTG CTGATTCCAC TAGGAGTTGA CCAAGACCCT 
CACTTTAGAC TAACAAGAGA CATTGCACCA AAGATTGGAA AAGAAAAACC TGCATTAATC 
CACAACATAA TGATTCCTGC ACTAGAAGGA CCTGGAGGAA AGATGTCAGC ATCTGATGAA 
AACGGTACAG TCTACACGAC AGATGCGCCA AATGTTGTAA AGAAAAAGAT CAACAAGTAT 
GCATTTTCTG GAGGACAGCC AGACTTGGAA CAACACAGAA AGCTTGGAGG AAATCCAGAC 
ATTGATGTGT CATACCAGTA TCTCAGAATA TTCTTTGAGC CAGATGACAA CAAGCTAAAA 
TCAATCTATG AAGATTACAA GTCTGGAAAA TTACTTTCTG GAGAACTAAA GGCAATTCTA 
ATTGAAAAGA TGAACGAGTT CCTAGCAGTA CATCAAGAGA ATAGAGAAAA AGCTAAAGAC 
AAGATAGACG AATTTCTTTT TGAAAACAAA TGA

Protein sequence

MSADDFVVTP WHVEGDIDYD KLIKQFGTQK ISPELLARIQ KITGEDHFML RRGIFFSHRE 
MNRILDDYEK GNKFFLYTGR GPSGHTHIGH LVPWVFAKWL QEKFDVNMYF QLTDDEKFFS 
KPNLTLEETK NFAYENALDF IALGFKPEKT KIIINTRNIQ TLYPIAAQVA KKINFSNTKA 
TFGFTNETNL GMIFYTSLQS APCFIEDKPV LIPLGVDQDP HFRLTRDIAP KIGKEKPALI 
HNIMIPALEG PGGKMSASDE NGTVYTTDAP NVVKKKINKY AFSGGQPDLE QHRKLGGNPD 
IDVSYQYLRI FFEPDDNKLK SIYEDYKSGK LLSGELKAIL IEKMNEFLAV HQENREKAKD 
KIDEFLFENK