Gene Nmag_1438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_1438
Symbol
ID	8824271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	1469484
End bp	1471148
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	62%
IMG OID
Product	extracellular solute-binding protein family 5
Protein accession	YP_003479579
Protein GI	289581113
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.3177
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAGACG ATAGCAAATC GCGGCGTACC GTGCTGAAGG GTGTTGGGAT TGCAAGCGCA 
GCGGGGCTAA CGACTAGTCT CGCAGGATGT GTCAGTCAGA ACGGTGGCTC AGATGTCGAA 
GGTGCGGAAA ATCTCGGTGA CGAAGTGCCC GAGATTCATC TCGTTGCACC GACGGCAGGT 
GCGAACCCGT TCCGTAACGA GCTCTCGGAT ATCGTTGCCG ACAACTGGGA AGAACTCGGC 
TTCGAGGTCG ACCGCGAAGA ACTCGATTTC AACGCTCACG TCGATCAGGT GGTCGTCGAA 
CAGAACTTCG ATGCGTCGCT ACTCGGCTGG GGTGGCACGC CGGAGCGGAT CGACCCGCAC 
ACGTTCATTT TCGACATGCA CCACTCCTCG ACGACGGGAG AGGGCGGTCG AAACACGCCG 
GGCTGGGAGA GCGACGAGTA CGACGAACTG GCGGAGCTGC AGGTAGCGCA GGTCGACGAA 
GACGAGCGCC AGCAGACCGT CTACGAGGCA CAGGAGATGA TCGCGGAAGC GCAGCCGCGA 
ACGTACATCG CAAACGAAGG CGGCTACGAG CCATACGCGA GCGCCCGCGT TACCGACATC 
AACCCGACGC TCGGTGAAGG GCTGAACTCG TTCTGGAATC TGACGTCGGT GACGCCGACG 
GACGACGACA CGGTCCGCTT TGGTTACCCA TCCGAGATTA TCTCGCTGAA CCCAATGCAG 
GACCTGGCGA CGCCCGACCG GCAGTTCGTC CGCCTCATCT ACGATCAGCT CTACCGGATC 
GGTGAGGACG GAATGCCGAC ACCGTGGCTG GCGGCGGACG ACCCGGTCAT CGAAGACGAC 
GGGATGACCT ACACCGTCGA GATTCGGGAC GGCCACACCT TCCACGACGG CGAGTCAGTG 
ACGATCGACG ACGTGGAGTT CACGTACGAA CTCTACGCCG ACTCGCCGAC GTACAGCTCG 
CTCGTCGAGG ACATCGACGA GATCGACACC TCGGGGAACG AGATCACGTT CCACCTCGAA 
GAGCAGTACT CGCCGTTCGT GGCAAACGTC CTCGGACAGG TGTACATCTT CCCCGAACAC 
GTCTGGGGCG ACGTCGATCC GGAGGAACTC GTCGACTACG AAGACGAGGA TTGGATCGGC 
AGCGGCCCGT TCGAGTTCGT CGACTGGGAG CGCCAGGCCG AACTGCAGCT GTCGGCGTTC 
GACGACCACT TCGAGGCCCC GAACGCGGAC AACCTCATCC GTGTCCCCGG TTCCGACACC 
GCACAGCTCG TCAACGACCT CGAGGCCGGC CAGCTCGATA TGGTCGGTGC GGTGCCACAG 
CCGACGGCTG TCGACCGCGT CAGAGAGGAC GACGATCTCG ACCTCGCCGA GTTCGAGGCG 
ATCGGATACG CGATGATCGA GTACAACATG CGTCGCGAAC CGTTCGACGA CCGTCACGTC 
CGCCGGGCAC TCTCCTACGG TGTTCCGAAG GAGGAGTACG TCGAGTTCAT CCGTGACGGG 
ATGGGAACGG TGACGCACTC GACCATCTCC GAGCACAACG AGTTCTGGCA CAACCCCGAC 
GTCGAGCAGT TCAACGAGGA CTTAGAGGCT GCACGTCAGG AGCTCGCAGA CGGTGGCTAC 
GGCTGGGACG ACGACGGACG TCTCCACTAC GGCGAAGACC AGTAA

Protein sequence

MGDDSKSRRT VLKGVGIASA AGLTTSLAGC VSQNGGSDVE GAENLGDEVP EIHLVAPTAG 
ANPFRNELSD IVADNWEELG FEVDREELDF NAHVDQVVVE QNFDASLLGW GGTPERIDPH 
TFIFDMHHSS TTGEGGRNTP GWESDEYDEL AELQVAQVDE DERQQTVYEA QEMIAEAQPR 
TYIANEGGYE PYASARVTDI NPTLGEGLNS FWNLTSVTPT DDDTVRFGYP SEIISLNPMQ 
DLATPDRQFV RLIYDQLYRI GEDGMPTPWL AADDPVIEDD GMTYTVEIRD GHTFHDGESV 
TIDDVEFTYE LYADSPTYSS LVEDIDEIDT SGNEITFHLE EQYSPFVANV LGQVYIFPEH 
VWGDVDPEEL VDYEDEDWIG SGPFEFVDWE RQAELQLSAF DDHFEAPNAD NLIRVPGSDT 
AQLVNDLEAG QLDMVGAVPQ PTAVDRVRED DDLDLAEFEA IGYAMIEYNM RREPFDDRHV 
RRALSYGVPK EEYVEFIRDG MGTVTHSTIS EHNEFWHNPD VEQFNEDLEA ARQELADGGY 
GWDDDGRLHY GEDQ