Gene Nmar_0100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0100
Symbol
ID	5773637
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	90221
End bp	91510
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	33%
IMG OID	641315720
Product	glutamyl-tRNA(Gln) amidotransferase subunit D
Protein accession	YP_001581438
Protein GI	161527612
COG category	[E] Amino acid transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0252] L-asparaginase/archaeal Glu-tRNAGln amidotransferase subunit D
TIGRFAM ID	[TIGR00519] L-asparaginases, type I [TIGR02153] glutamyl-tRNA(Gln) amidotransferase, subunit D

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.00378073
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCAGAAT ATAGAGGATA TGAAGGCAAT TCGTTAGAAT TTCTAAAGAG CAATCAAGTA 
GTTGTTGGAG ATTCAGTCAA AATCCTCTCA GATATTACAT ATTCAGGCAT AATTATGCCT 
CGATATGAGC ATAGTGACGA CAAACACATT GTTCTGAAGT TAAAGAGTGG GTATAATGTG 
GGATTAGAAA TTGCAAAAAT TGAGAGTATT GAAAAAATTC AATCATCAGA AAAAAATATT 
GATGAACTTG AAAAAATCAG CAAAATAGAC GGATTACCAA AAGTATTGTT ACTTTCAACA 
GGAGGTACGA TTGCAAGTAA AGTAGACTAT AGAACAGGAG CAGTTACTCC AGTGCTAACT 
GCAGAAGAAT TGAATTCATC AGTTCCAGAG CTTTCTAAAA TTGCAAATAT TGATGCAGAA 
GTTTTGTTAT CAGAATATTC TGAAAACATT ATGCCAGAAA ATTGGTTAGA GATAGCTAAT 
AAAATTAGTA GTTATTCAAA TTCAGACTAT TCAGGAATTA TCATTGCTCA TGGAACAGAC 
ACAATGCATT ATACATCATC ATTTCTTTCA TTTGCACTCG CAGGATTTCC AGTTCCAATT 
GTTTTAGTTG GTTCACAAAG ATCATCGGAT AGAGCATCAT CAGATGCAGC ATTAAATCTA 
ATTGGTGCCA CTAAATTCAT TACCGAAAGC AAAACAAAAG GAGTGTACAT TGTTATGCAC 
AATGATGAAA ATGACAATAC CGTTGCATGT CACATTGGAA CAAGAGTTAG GAAAAATCAT 
ACAAGTAAAC GAGGAGCATT TCAAACAGTA GGAGATGATC CTGCTTTCAT AATTGCAGAA 
GAAAAAATTC AAAAAAATAT TTCAAAAGAG TTCTATAAAG TTCAAAAATT CCAACCAAAA 
ATTAATCTAG ATACAAAAAT TGCATTAGTA AAATACTATC CAGGATATGA TCCAAAATTA 
GTTGAACAAA TTATTGACAA CGGATACAAA GGAATAATCT TTGAAGGTAC AGGATTAGGA 
CATATTGGAA GGGTCATGTA TGATTCTGTA AAAAAAGCTA GTGAAAAAGG GATATTTCTA 
GGCATGACAT CACAGTGTAT TGATGGAAGG GTAAGAATGA CCGTCTATGA AAGTGGCAGA 
GATCTTCTAA ATTTAGGCAT AATTCCTTTA GAGAATATGC TTCCAGAAGT TGCTCTAGTA 
AAAGCAATGT GGGCATTAGG AAATACTCAG AATATTGAGG AAGTAAAAGA AATTATGCTT 
GATAATATTG CATCTGAAAT GTCAATTTAG

Protein sequence

MSEYRGYEGN SLEFLKSNQV VVGDSVKILS DITYSGIIMP RYEHSDDKHI VLKLKSGYNV 
GLEIAKIESI EKIQSSEKNI DELEKISKID GLPKVLLLST GGTIASKVDY RTGAVTPVLT 
AEELNSSVPE LSKIANIDAE VLLSEYSENI MPENWLEIAN KISSYSNSDY SGIIIAHGTD 
TMHYTSSFLS FALAGFPVPI VLVGSQRSSD RASSDAALNL IGATKFITES KTKGVYIVMH 
NDENDNTVAC HIGTRVRKNH TSKRGAFQTV GDDPAFIIAE EKIQKNISKE FYKVQKFQPK 
INLDTKIALV KYYPGYDPKL VEQIIDNGYK GIIFEGTGLG HIGRVMYDSV KKASEKGIFL 
GMTSQCIDGR VRMTVYESGR DLLNLGIIPL ENMLPEVALV KAMWALGNTQ NIEEVKEIML 
DNIASEMSI