Gene Nmag_1462 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_1462
Symbol
ID	8824295
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	+
Start bp	1491359
End bp	1492537
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	64%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	YP_003479602
Protein GI	289581136
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCCGG CTGCCGTGAT ATTGTCCGTC ATGCACGGAT CGGACGGGAC TCGAGTACCT 
GGCCATGATC ACGGCGGTCG ACGCAGTCGC AGCTACGATC GGCGACGATT TCTCGCAGCA 
GCGGGGGTCG TCTCGGCGGG AGTCGTGAGC GGCTGTCTCG GACTCGGAGA CGACGAATCG 
GACGTGCTCG GGGATCCCGA GTATCGGGAG GGGCGACCCG ATCCGGGTGG TGTCTCGATA 
GAAGAGATGC CGGATCTGAA CGGAGATTTG ACGATCTACT CTGGGCGCAG CCAGCCGCGG 
ATCGGCGAAC TGATCGAGTA CGTCGAGGCA CAGTACGACG AACTGACCAT CGAGGTCAGA 
TACGACGATA CCGCGGACCT GATCAGTACG ATCGAGACGG AGGCCGAAAC GCCGGCGGAC 
GTCTTCTACG GCAGCGAGAC ACAGTCGATG ACCCACCTCA AGGACGAGGG TTACACCGTC 
GAGTTGCCTG ACGAAGTCAT CGATTTGGTC GACACGGGCT CAATCGATCC GGACGGCCAC 
TGGACGGGTT TCACCCGCCG ATTTCGGGCG ATGGCGTACA ACAGAGACGC GTACGATGCG 
GACGAGCTAC CGGACGACAT CTTCGCCTAT GCGGAGGACG AACGATTCCA GGACGAGATC 
ATGTGGCCGC CGGATCAGGG CTCGTTCCAG GCGTTTCTCA CCTCGATGCG GCTGCTCCAC 
GGCGAGGAGG AGACCCGCTC GTGGGTCCAA TCGATGACCG ACGACCAGGG TGTCGAGGCG 
TCTCCGGGCG GCGACAGCGC GCTGGCACAG GCCGTCGGCG ACGGGGAGGT CAGCGTCGGG 
CTGACGAACC ACTACGTCGT CCGCGACCAC GGCGGCGACT CCGTCGGCCT GGCGTTCACC 
AGCGACGACG CGGGGGCGAT GTACAACGTC ACCGGCGGTG CGGTGATGGC CGACAGCGAC 
GACACCGAGA CCGCCGCGAA CTTCGTCCAG CACATGCTCT CGGCGGAAGC CCAGGAGTAC 
TTCGCGACGA CCACCTGGGA GTACCCCGTC ATCGACGGCG TCGCCCCACT CGAGGAACTC 
CCTGGCACAG ACGAGTTCGA GCCACCCGAG TTCGACCTGA ACGAGCTCGA CGATCCCGAC 
CCGACGCTCG AACTCCTGCG CGAGGAGGAC GTTCTCTGA

Protein sequence

MQPAAVILSV MHGSDGTRVP GHDHGGRRSR SYDRRRFLAA AGVVSAGVVS GCLGLGDDES 
DVLGDPEYRE GRPDPGGVSI EEMPDLNGDL TIYSGRSQPR IGELIEYVEA QYDELTIEVR 
YDDTADLIST IETEAETPAD VFYGSETQSM THLKDEGYTV ELPDEVIDLV DTGSIDPDGH 
WTGFTRRFRA MAYNRDAYDA DELPDDIFAY AEDERFQDEI MWPPDQGSFQ AFLTSMRLLH 
GEEETRSWVQ SMTDDQGVEA SPGGDSALAQ AVGDGEVSVG LTNHYVVRDH GGDSVGLAFT 
SDDAGAMYNV TGGAVMADSD DTETAANFVQ HMLSAEAQEY FATTTWEYPV IDGVAPLEEL 
PGTDEFEPPE FDLNELDDPD PTLELLREED VL