Gene Nmag_3933 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3933
Symbol
ID	8826803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013923
Strand	+
Start bp	336385
End bp	337875
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	67%
IMG OID
Product	peptidase M20
Protein accession	YP_003482036
Protein GI	289583626
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCGACT CGAGTACGCC CGCCGGCGCG TCCGATCCCA CGGACGCCCT CGAGGAACAC 
GACGAGACGT TCCGCACCGA TCTCGAGTCG TTGCTCGCCC AGCCCTCGAT CAGCGCGACC 
GACGAGGGCG TTGTCGAGTG CGCCTCGATG GTGCAGGAAC TGTGTCTCGA GTACGGCTTC 
GACGAGGCGG AGATCGTCGA GACGCCGGGA CAGCCGGCGG TTATCGCGCA TGCGGCGGCC 
GACCGTGGCG GAGAGGCGCG AGAAAAAGCG GCTGACGATG ACGAGACCAG TCAGGAGACA 
CCGACAATCC ACCTCTACGG CCACTACGAC GTCCAGCCCG CGACACCCGA GGAGTGGGAC 
TCACCGCCGT TCGAGCCAAC CGTCCGCGAG GGGCCCGACG GCGAGCAGCG CCTCTACGCC 
CGCGGCGCGG GCGACAACAA GGGCCAGTGG TTCGCCCACG TCTGTGCCGT CCGCGCACTG 
CGCGAAACCA CCGGCCTCCC CGCGAACGTC ACCCTCCTGA TCGAGGGCGA GGAGGAAAGC 
GGCAGCGAGC ATCTCGAGTG GCTCGTCCGC GAGCACCGGG ACGACCTCGC CTGCGACGTT 
GCCGTCGTCG CGGACGGGCC GATCGATTCG TCGGGACGGC CCCACGTCCT GCTCGGCGCG 
CGCGGACTCC TGTACGTCGA CCTCGAACTG CGCGGGGCGA ATCAGGACCT GCACTCGGGC 
AACTTCGGCG GCCCGGTGCC GAACCCGGCC GCCGCACTCA CCGATCTACT CGCCTCACTC 
GAGGACGACG GGCACGTGAC GCTCGATGGA TTCGACGACG ACGTGCGGCC GCTAACCGAC 
CGCGGTCGAG AAATCGTCGC GGAGATTCCG GTCGACGAGG ACGAGATTCG AGACGAACTC 
GCGCTCGACG CGTTCGAAAC CGATGCGGAC GAGAACTACG TCGAGCGCCT GCTTACGCGT 
CCGAACCTCA ACGTCGCGGG GCTCGACGCG GGCTACCACG GCGACGGGAT GAAGACGGTG 
CTCCCCTCGG AAGCGAGCGC GAATATCGAC TTCCGACTGG TTGCCGACCA GGATCCGGAC 
GCGATCTACG AGTCGCTCGT CGACTACGCG ACGGCACACG TGCCGGCTGG CATCGAGGTC 
GAACTCTCCC GCGTCGCCGC GATGGCACCG CAGCGGACGC CAGCCGACAG TCCCGTGGTC 
GAGCCGGCGA TGCGGGCGAC GCGCGAAGGA TGGGGCACCG AGCCGATTCT GAAGCCGACA 
CTCGGTGGGT CTGTTCCGAC GTACGTCTTC GCGGACAACT TGGACGTGCC GTGTCTCGTG 
ATCCCCTACG CGAACGAGGA CGAGCGTAAC CACGCGCCGA ACGAGAACCT CAAACTCTCG 
TGCTTCCGCG CAGGGGCACG GACTACAGTA GCACTCCTTT CGGAGTTTGC CGAGGCAGAT 
CTTTCGGGTT CCTCGGCCTC GGCCTCGTCC TCGACCTCAA CTTCGACTTA G

Protein sequence

MTDSSTPAGA SDPTDALEEH DETFRTDLES LLAQPSISAT DEGVVECASM VQELCLEYGF 
DEAEIVETPG QPAVIAHAAA DRGGEAREKA ADDDETSQET PTIHLYGHYD VQPATPEEWD 
SPPFEPTVRE GPDGEQRLYA RGAGDNKGQW FAHVCAVRAL RETTGLPANV TLLIEGEEES 
GSEHLEWLVR EHRDDLACDV AVVADGPIDS SGRPHVLLGA RGLLYVDLEL RGANQDLHSG 
NFGGPVPNPA AALTDLLASL EDDGHVTLDG FDDDVRPLTD RGREIVAEIP VDEDEIRDEL 
ALDAFETDAD ENYVERLLTR PNLNVAGLDA GYHGDGMKTV LPSEASANID FRLVADQDPD 
AIYESLVDYA TAHVPAGIEV ELSRVAAMAP QRTPADSPVV EPAMRATREG WGTEPILKPT 
LGGSVPTYVF ADNLDVPCLV IPYANEDERN HAPNENLKLS CFRAGARTTV ALLSEFAEAD 
LSGSSASASS STSTST