Gene Nmag_1942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_1942
Symbol
ID	8824783
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	1976302
End bp	1977633
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	64%
IMG OID
Product	protein of unknown function DUF214
Protein accession	YP_003480075
Protein GI	289581609
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGCCAC TCGAGTTCGG TCGACTCGCC TGGCGCTCGA TCGGGAGCCA TCGGTTGCGC 
TCGGCGCTGA CGACCCTTGG GATTATCATC GGTATCGCGG CGGTGATCGC GTTCGTTACG 
CTGGGTGCGA GCCTGCAGGC CGGCCTGCTC GGCGACATCA GCCCGGACGA TCAGCGGAAT 
CTCTACGGGT GGGCCGCCGA TCCAGACACG GAAGGTGGCC CACTCGCCGG TGCGCAACCG 
GTGTTCACGC AGGACGATCT CGAACAGGTG GACGAACTCG AGGACGTCGA CGCGGCCTAC 
GGCTATATGC CGATTTCGAC GCAGGCGCTC GCCTACGACG GTGAGCTAAC GCCACAGAGC 
GATGCGCTGA TCGCCGCGGG ACCACCGTAC ATCAGACCGG CGACGATCGA CGAGGGTCGG 
CAGTTCGAGA TGGGCGAACG TGAGGCAGTG ATCAACCCGG CAGTGGCCGG CCAGTTCGAG 
GAGAACGTCT CCGTCGGCGA CGAGTTGACC ATCGTCAGGC AGGGCGGCGA GCAGACGTCG 
GTGACTGTCG TCGGGATCAC GGACAGTTCT GAGGGACTGA GTCCGTTCGA AGGGTTCGAG 
CCGTCGCCAC GGGTGTACGT GCCGACGGAC CCCTACTACA CGGAGGAGGT AGACGGGATC 
GGTGCCGGGT TTGGTGGTGA CGAAGCAGCT GAAGACGAAG CGGACGAGGC GGATCCAGCC 
GACGGCGATG ACGGCGATGC AGCAACCGCC GAGGACGCCA GATTCCTCGC AATCGTCGTC 
GAGGCACCGT CTGCCGACGA GGGGGATATC GACCAGGCTC GCGACAGCGC ACTCGCCGTA 
CTCGAGAGCG ACGACTCCGA CGCGAGTGAG TTGCTCGGCG ACGACCTCGA GATCACCATG 
CAGACGAGCA CCGAGTTGCT CCAGCAGCTA CAGGACATAC TCGACCTGCT GCAAAACTTC 
ATCGTCGGCA TCGCGGCTAT CTCGCTCGTC GTTGGTTCGA TCGGCATCGC GAACATTATG 
CTGGTCAGCG TCACCGAGCG GACCCGTGAG ATCGGGATTA TGAAGGCCGT TGGTGCGCAG 
AACCGGGACG TGTTGGGCCT GTTCCTGACG GAAGCGGTGG TGCTGGGAAT CATCGGTGCC 
ATCCTCGGCA CGGTACTCGG ACTCGCCGTT GGGTACGCCG GGGCGTGGTA CATCGATATT 
CCGCTCGTCT ATCCCTACGA GTACGTCGCG CTCGCTGTCG CCGTGGGAAT CCTCGTCGGC 
GTTCTCTCGG GGCTCTATCC CGCCTGGCGG GCGGCCCGAA CGGATCCGAT CGACGCGCTT 
CGGTACGAGT GA

Protein sequence

MRPLEFGRLA WRSIGSHRLR SALTTLGIII GIAAVIAFVT LGASLQAGLL GDISPDDQRN 
LYGWAADPDT EGGPLAGAQP VFTQDDLEQV DELEDVDAAY GYMPISTQAL AYDGELTPQS 
DALIAAGPPY IRPATIDEGR QFEMGEREAV INPAVAGQFE ENVSVGDELT IVRQGGEQTS 
VTVVGITDSS EGLSPFEGFE PSPRVYVPTD PYYTEEVDGI GAGFGGDEAA EDEADEADPA 
DGDDGDAATA EDARFLAIVV EAPSADEGDI DQARDSALAV LESDDSDASE LLGDDLEITM 
QTSTELLQQL QDILDLLQNF IVGIAAISLV VGSIGIANIM LVSVTERTRE IGIMKAVGAQ 
NRDVLGLFLT EAVVLGIIGA ILGTVLGLAV GYAGAWYIDI PLVYPYEYVA LAVAVGILVG 
VLSGLYPAWR AARTDPIDAL RYE