Gene Nmar_1763 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1763
Symbol
ID	5773569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	1609931
End bp	1611076
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	31%
IMG OID	641317418
Product	class V aminotransferase
Protein accession	YP_001583097
Protein GI	161529271
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTTAG TATCAAAGGA TATTTCAGAT GACTTTCCAA ATTCAGATAA AATCTATCTA 
AACAATGCAT CAGTATCCCT AATGCCTATT CAAAGTATTG AGGCAATGAA AGATTTTCTA 
ATTTCTTACA ACTCTCTTGG ACCTGATTCA AAAGAATCAG AGTCATTCGT AACTGAAAAA 
CTAAGAGATG TAAGAAAAAC TATAGCCAAA ATTATCTCAT GTCAACCTGA TGAAGTAGTT 
CTAACTCAAA GTACTACTGA TGGAATCAAT ATTGTAGCAA ATGGACTTTC ATTTGATGAA 
AAATCAAATG TAATTATTCG TGGAATGACC CATGAACATC ATTCAAATTT TTATCCCTGG 
TTAAAACTAA AAGAAAAAAT CTCTCTAAAG AATCTCTCAA TTGATAAAGA TGGATTTTTC 
AAATCTGAAG ATTTAGAATC ATTACTTGAT GATAATACAA AATTAGTTGC TCTTAGTCAT 
GCTTTGTACA ATACTGGTTC TATTTTGCCT TTAGAAGAAA TCACAAAACT ACTCAGTGAT 
GTGCCTCTAT TTGTTGATAG TGCACAAACT GTAGGATGTA TTGACGTTGA TGTTTCAAAA 
ATAAATTGTA ATTTTATGTC TTTTAATGGA TCAAAATGGC TTTGTGGTCC AATGGGAACT 
GGATTGTTTT ATTGTAATAG AAAATCAAGT GAATTGTTAG AACCAAAAAC TATTGGGGGC 
GAATCTGCAA TTATCTATGA TGATACCAGT TTAGCATTCA AAGAACTTCC TGATAAATTT 
CAAACTGGTT TTAGAAATTA CGTTGGAATT GTTGGATTGG AATCTTCTGC AAACTATTTG 
CTTAATTTTG GTCTCAAAAA TATACGTGAA AAAAATCAAT ACTTGTCAAA TCTTCTAAGA 
GAAGAACTAT CAAAAATTCC AAAAATTATT TTGTATGGTC CTGAAGATCC TAATTCTAGA 
ACAAGTATTG TGTCTTTTAA CATAGATGGA ATGGATTCAC AAGAGGTTGT TGATAGACTT 
GAAAAGCAAA ACATCGTCTT AGCTCTAAGA GAAATTATGG AAACAAAGAT TGTGCGAGCT 
TCACCTCATT TCTTTAACTC AGAATCTGAA ATTATGTCTG TAGTTGATGC AATAAAGAGA 
CTATAG

Protein sequence

MNLVSKDISD DFPNSDKIYL NNASVSLMPI QSIEAMKDFL ISYNSLGPDS KESESFVTEK 
LRDVRKTIAK IISCQPDEVV LTQSTTDGIN IVANGLSFDE KSNVIIRGMT HEHHSNFYPW 
LKLKEKISLK NLSIDKDGFF KSEDLESLLD DNTKLVALSH ALYNTGSILP LEEITKLLSD 
VPLFVDSAQT VGCIDVDVSK INCNFMSFNG SKWLCGPMGT GLFYCNRKSS ELLEPKTIGG 
ESAIIYDDTS LAFKELPDKF QTGFRNYVGI VGLESSANYL LNFGLKNIRE KNQYLSNLLR 
EELSKIPKII LYGPEDPNSR TSIVSFNIDG MDSQEVVDRL EKQNIVLALR EIMETKIVRA 
SPHFFNSESE IMSVVDAIKR L