Gene Nmag_3901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3901
Symbol
ID	8826771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013923
Strand	-
Start bp	297358
End bp	298647
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	63%
IMG OID
Product	peptidase M24
Protein accession	YP_003482004
Protein GI	289583594
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.337713
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTACC TATCCATGTC GTTTCACGAC CGGCAGTTTA TGGCGGGTAC TCGAGGAACG 
CAGGCGGTCG ACTGGGAACA GCGCATCGAT ACCCAGCGCC TCCGCGAAGA GCGCAAAGCG 
AGGGCGCTCG AACGCCTCCA GGAGACCAAC CTCGGGGCCA TGCTCCTCGT CTCGGATCCG 
AACATCCGCT ACGTGACCGG GCTGGCGATG ACCGGTGGCA GCGGCGCGGA CCACTACACC 
CTCCTTACCG AAAACGGCGA CATCGTTCAC TGGGACACCG CGGACCACGC GAGCAACCAG 
CGGTTCAACT GCCCGTGGCT TCACGACATC CGTTATGCCT GTCCGGGGCT CGGCAACGTT 
CCGCGAGCCT CTGGCAGCGC CTCGGCCCGC CAGTTCCTGC GATCGAAGAT GGCCGAAACC 
GTTCACGACG CGATGGAAGA GTACGGCGTC GCCGACGAGA CGCTCGGGAT CGATATCGGC 
AATCAGAGTC TCGTCTCGGT GTTCGAGGAC CGCGGCGTTG ATGTCGATGT CGACACCGCA 
CAAGCGGTGA TGGAGGACGC CCGGAAGATC AAAACCGAGG ACGAGATCGA GTGTTTACGG 
ATGGTCGCCT CGATCTGTGA GGCTGGCTTT CAGACCATCA AGGACACCGC CAAGCCGGGG 
ATGCGCGAGA CCGAGGTCTG GGGCGAAGCC GTCCGCGAAC TCTGGCGTCA CGGCGCGTTC 
GTCGGCGGCG GCTACGTTAC GTCGGGGCCG AACACGTGGC CCAAACACCA GGCGAACACC 
ACCGACCGGG CGATCCGCCC GGGCGACCTC GTCTACGCCG ACTTCTACAA CATCGGCTAC 
CTCGGCTACC GGTCGTGTTA CTACCGCACC TTCTCGATCG GCCAGCCAAC GCAGGCACAG 
CAGGACGCCT ACGAAAAAGC ACGGGACGAT CTGTACAACG TACTCGAGTG CATCGAGCCC 
GGTGCGACGA CCGACGAGAT CTGCCAGGCG TTCCCGGACG AAGAAGGCGA GCACATGGAC 
TGGTACGACG CCGACGAGTT CTGGGAGATG ACGACGAATC ACTGGGCCCA CGGTCTCGGG 
CTCCAGCTCT ACGAAGTGCC GCTGATCTGG CGTGGCCTTT CACCGGACCA TCCGATCGAG 
ATCGAGGAGG GGATGACGAT GGCCGTCGAG ACGATGCAGC CGGCGGATAG ACAGGGTGTC 
CGCGTCGAAG AGATGGTCGT CGTTCGCGAG AACGGCGTCG AGATTCTGAG TCAGTGGCCG 
GTCGAGGAGA TTACGGTTAT CGACCACTGA

Protein sequence

MRYLSMSFHD RQFMAGTRGT QAVDWEQRID TQRLREERKA RALERLQETN LGAMLLVSDP 
NIRYVTGLAM TGGSGADHYT LLTENGDIVH WDTADHASNQ RFNCPWLHDI RYACPGLGNV 
PRASGSASAR QFLRSKMAET VHDAMEEYGV ADETLGIDIG NQSLVSVFED RGVDVDVDTA 
QAVMEDARKI KTEDEIECLR MVASICEAGF QTIKDTAKPG MRETEVWGEA VRELWRHGAF 
VGGGYVTSGP NTWPKHQANT TDRAIRPGDL VYADFYNIGY LGYRSCYYRT FSIGQPTQAQ 
QDAYEKARDD LYNVLECIEP GATTDEICQA FPDEEGEHMD WYDADEFWEM TTNHWAHGLG 
LQLYEVPLIW RGLSPDHPIE IEEGMTMAVE TMQPADRQGV RVEEMVVVRE NGVEILSQWP 
VEEITVIDH