Gene Nmag_1151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_1151
Symbol
ID	8823982
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	+
Start bp	1173260
End bp	1174462
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	63%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	YP_003479297
Protein GI	289580831
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCACTGC AACGCAGGCA ACTCCTCGCG GGGATCGGGG GAGCCGCAAC GCTGACAGTC 
GCAGGATGTC TCGGTGACGA TGACCGCGGT ACCACGCTCT GGAACGAGTT CGAAGACGCT 
GAAGAGGAGA CGCTCGAAGA GCACCTCGAA GTGTTCAACG AGGGTCGTGA CGACGAACTC 
AACGCGGATA ACATCGCCGA TATGGAAGAC CAGCTCGAGA CGGCGATTCC AGCCGGTGAC 
GGTCCTGGAA CGTTCGCATG GGCGCACGAC TGGCTCGGGC GCTACCACGA CCAGGAGTTC 
GGCTACGATG CCAGTGGCGA CCTCTCGCTC GACCTTGAGA GCGAGTTCAC CGCTGACGCT 
GTCGACGCAG TCCAGTGGGA GGGGCACACC TACGGCGTCC CGTACGCGTC CGAGACGGTG 
ACGCTAATGT ACAATCCAGA TCTTGTCGAC GAGCCACCAG AGACGCTCGA GGAGATGGTC 
GACATCATGG ACGACCACCA CGACCCGTCC AACGGCCAGT ACGGCCTCTC GTACCCACCG 
GTCGATCCGT ACTTCGTCAG CGGCTATCTC CACGCCTTCG GCGGCCGAAT CTTCCACGAG 
GATACCGGCG AACTCGGCAT CGAAGACGAC GAGTTCATCG AGGGCCTCGA ACTACTCCAG 
GACAACCTCT GGGAGTACGT TCCTGAAGAC CCAGAGTACG GGTCCCAGAT GGCACCGTTC 
AACGACGGCA ACGCACCGTT CGCGATCAAC GGTCCGTGGC AGGTCGGCGG CTTCCGGGAT 
GCTGGCGTCG ACGCGACGCT CGCACCGCTG CCGGACGTCG ACGGCGGATC GCCGACGCCG 
TACACCGGCA TTCAGGTCTG GTACTTCACT GCCGCACTCG AGGACGCAGA CGAGACCACG 
TTCGAGACGA TCATGGACTT CGCCGAGTGG TACACGACGA ACGAGGACGT CATCGTCGAC 
AACGCCGAAC GGCACGGCCT GATTCCAGTC CATCAGGAGT ACGCAGAGAG CGACGACCTG 
GGTGAGGACG TCGAGACCTT CATCGAAACC GTCGAGATGG GAACGCCGAT GCCGGCCGAC 
CCGCGAATGG ACCTCGTCTT CACGCCACTC GAGGAGGCAC TCGAGCGCGT GTTCAACGAG 
AGCGAAGAAC CGGCCGAGGC GATGGAAGCG GCAGCCGAAG AGATTCGCGG ACGCTGGGAC 
TAA

Protein sequence

MPLQRRQLLA GIGGAATLTV AGCLGDDDRG TTLWNEFEDA EEETLEEHLE VFNEGRDDEL 
NADNIADMED QLETAIPAGD GPGTFAWAHD WLGRYHDQEF GYDASGDLSL DLESEFTADA 
VDAVQWEGHT YGVPYASETV TLMYNPDLVD EPPETLEEMV DIMDDHHDPS NGQYGLSYPP 
VDPYFVSGYL HAFGGRIFHE DTGELGIEDD EFIEGLELLQ DNLWEYVPED PEYGSQMAPF 
NDGNAPFAIN GPWQVGGFRD AGVDATLAPL PDVDGGSPTP YTGIQVWYFT AALEDADETT 
FETIMDFAEW YTTNEDVIVD NAERHGLIPV HQEYAESDDL GEDVETFIET VEMGTPMPAD 
PRMDLVFTPL EEALERVFNE SEEPAEAMEA AAEEIRGRWD