Gene Nmag_3646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3646
Symbol
ID	8826514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013923
Strand	-
Start bp	29081
End bp	30226
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	65%
IMG OID
Product	peptidase M42 family protein
Protein accession	YP_003481756
Protein GI	289583346
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0943449
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCTCA AACGGACGGA ACTCGACCGA CTCGTCGCTG CTCGCGGCGG TCCCGGTGGC 
GAGTATCACG TCGCCCGTGT TTTCGAGGAA TTGATCGAGC CGTACGTCGA CGAGGTGTCG 
TGGGATTCGA TGGGAAACGT CGTCGCGACG AGTTACGGTG AGGACGACTC CAGTGCTGAC 
GATACCGACG ATAGCGGTTC GAACGGGACC GACACTGGTA CCGGCATCGA CAACGACACA 
GACACCAAAG ACGTCCTCCT CGCCGCCCAC ACTGACGAAC TCGCGTTTCT GATCGACGAT 
ATCACTGAGG ACGGCCTCTG CTCGTTCTCG ATGCTTGGCG GCCACTACCG GGGCTATCTC 
CCCGGGCAAC ACGTGCTCGT CGGCCCCGAC AAGGTTCCCG GCGTCGTCGG GACGAAGCCG 
CGACACTTCA TGGACGGCGA CGAGAAAGGC AGTCTCCCTG AAACCCTGCA CATCGACCTC 
GGTGCCCGAA GTCAGGAGGA AGTGGCCGAA CTAAACGTCG AACCCGGCGA CCACGCAACC 
TGGGACCGCG AACTAACCGA CCTCGCAAAC GGCCGACTCG CGGGCCGAGC GCTCGACGAC 
CGCATCGCAC TCGCAATCCT CGTCGCCGTC GCCCGCGAGA CCGACTCGGA TCGAACCGTC 
CACTACGCCG CCACCGTCCA GGAAGAAGTC GGCCTCCGCG GTGCCCGTGC TGCAGTTCAC 
GAGGTGGATC CTGACATCGC CATCGCACTC GAGATCTTCC CGAGCGACGA CTACCCGATC 
GACGGCGACC GATCGAGTAC CGTCGAACTC GGCGCTGGTC CGGTAGTGGA GTTCGGCGAC 
GGCACCTCCG AGTACCTCTT CGGTGGCGTC CTCGTCGATC GACAGACACT CGAGTGGCTC 
ACAGCCGCCG GGTCGTCGGC CGACGTGACC CTCCAGCACG ACGTCATGAT CGGGGGCACG 
ACCGACGCGA CGGAGTTCCA GAGTGCCGGC CGGGCGCGCC ACGCTGGCGC GATTGCTGTC 
CCCTGTCGGT ACACGCACTC ACCTGTCGAG ACGATCGACC TCGACGACGC CGAGGAGACG 
GTCGATGTGC TCGTCGCTGC GCTGGAATCG CCGTTCCCGG GCCGGACTGA CGTGCGCGGG 
CGTTAG

Protein sequence

MALKRTELDR LVAARGGPGG EYHVARVFEE LIEPYVDEVS WDSMGNVVAT SYGEDDSSAD 
DTDDSGSNGT DTGTGIDNDT DTKDVLLAAH TDELAFLIDD ITEDGLCSFS MLGGHYRGYL 
PGQHVLVGPD KVPGVVGTKP RHFMDGDEKG SLPETLHIDL GARSQEEVAE LNVEPGDHAT 
WDRELTDLAN GRLAGRALDD RIALAILVAV ARETDSDRTV HYAATVQEEV GLRGARAAVH 
EVDPDIAIAL EIFPSDDYPI DGDRSSTVEL GAGPVVEFGD GTSEYLFGGV LVDRQTLEWL 
TAAGSSADVT LQHDVMIGGT TDATEFQSAG RARHAGAIAV PCRYTHSPVE TIDLDDAEET 
VDVLVAALES PFPGRTDVRG R