Gene Nmag_0080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_0080
Symbol
ID	8822899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	96366
End bp	97670
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	58%
IMG OID
Product	peptidase M20
Protein accession	YP_003478241
Protein GI	289579775
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.306901
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAGCC AATTCAAATC ATTCACCGAG AAACTCCTAT CATTCCGTAC AGAGTCCGGC 
AACGAACAAC CAGCACAGCG GTGGATTCGT AACCAGTTAG ATGCAGTTGG GTTCGAAACC 
TATGAGTGGA CGGCAGATCC GGAGCTGCTT GCGAACCATC CATCGTTTCC ATCAGATCCG 
GCCACAATAG AGACCGCAGA CCGGCCATCG GTGGCTGGCG TTGTTGAATT CGGGGATCCT 
GATGAAGGCC AAACGATCGT TCTCAACGGC CACGTCGATG TCGTCCCTGC TGAGGAAGCA 
CAGTGGGATA CTGACCCGTT CACGCCAACG TGGGACGGCG AGAAGCTGAT TGCCCGTGGC 
GCTGCAGACA TGAAAGCCGG CCTGAGCGCC TGTCTCTTCG CTGCAAAAGA ACTTGCTGCA 
CAAAACACAG ACAGCGACGA ACTGAATGGG CGTCTTGTCG TCGAGAGCGT CGTCGGCGAA 
GAGGAGGGCG GAATCGGTGC AGCAATGGCC GCACTATCGA ACCCGTATCC GTTTGAGCGA 
GATGCAGCAA TCGTTGCGGA ACCAACAGAG CTAGAGTTGG TCACAGCAGT CGAGGGCTCG 
GTGATGCTCC GGCTGGAACT CGAGGGGAAA TCTGCTCACG CGGCGACACG GTGGCGTGGG 
GAATCAGTAC TGCCGCACTT CGAGCGAATT CGAACAGCGC TTCGAGAACT GGAGACGGAG 
CGCTCTCTCA CCGTTACACA TCCACTCTAC GAGCGGTTTG AGACACCGTG GCCGATCTCA 
GTTGGAACAG TTCAGGCTGG TTCGTGGGCC TCCTCAGTTC CGGCGACGCT CACCGCTGAG 
ATACGGGTCG GTGTCGCACC CGGGGAAACA GTCACAGAGG TAGAGTCGGC CGTCCGCGAC 
CGGATTGACG CTGTCGTCGA CGGAGACGAC TGGCTCGAAG CACATCCCCC ATCACTCGAA 
CGGTTTTCAG TCCAGTTCGA ACCGGCGTCT GTGTCCCACG ATGAGCCGAT CGTCCGTCAC 
TTGCAAGCGG GAATGGAACA GAACGGCCTC GCAGATACCG CGCCAAAAGG CGCGACGTAC 
GGCGCGGATT CGAGACACTA TCAGGCTGCA TCGATACCAA CCGTTCTCTT TGGGCCGGGG 
TCGATCGACA ATGCACACTT CCCGAACGAG TCCATTCAGT GGGACGCTGT TGAACAGAGC 
AAAGATGTCC TCGTAGACAC GCTTGCAGCT ATTCTGGGGG AGGACACACC GACCAACACG 
GCCCGTACCA GCCACGAACC TGAAGGGTCA CGTTCGAAGA ATTAA

Protein sequence

MGSQFKSFTE KLLSFRTESG NEQPAQRWIR NQLDAVGFET YEWTADPELL ANHPSFPSDP 
ATIETADRPS VAGVVEFGDP DEGQTIVLNG HVDVVPAEEA QWDTDPFTPT WDGEKLIARG 
AADMKAGLSA CLFAAKELAA QNTDSDELNG RLVVESVVGE EEGGIGAAMA ALSNPYPFER 
DAAIVAEPTE LELVTAVEGS VMLRLELEGK SAHAATRWRG ESVLPHFERI RTALRELETE 
RSLTVTHPLY ERFETPWPIS VGTVQAGSWA SSVPATLTAE IRVGVAPGET VTEVESAVRD 
RIDAVVDGDD WLEAHPPSLE RFSVQFEPAS VSHDEPIVRH LQAGMEQNGL ADTAPKGATY 
GADSRHYQAA SIPTVLFGPG SIDNAHFPNE SIQWDAVEQS KDVLVDTLAA ILGEDTPTNT 
ARTSHEPEGS RSKN