Gene Nmag_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_2044
Symbol
ID	8824887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	2082974
End bp	2084047
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	64%
IMG OID
Product	transcriptional regulator, HxlR family
Protein accession	YP_003480176
Protein GI	289581710
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCACC CACCGACCCC GGCAGAGTCG ACCGCATTGT CGATCCTCGG CACCAAGTGG 
AAACCCCGGC TGATCGTTGC CCTCGCGACC AACGACCGGC TCAGCTTCGG CGATCTGAAA 
CGCGAACTCA CGGGTATCTC GGGGAAGGTG CTGTCGGAGA ACCTGGACGA ACTGCGCGAT 
CACGGCGTCG TTTCCCGCGA CGTCGTGCAA CAACAGCCTC GGCGCGTCGA GTACGAACTA 
ACCGGGGCCG GGCGAGAGCT GTACCAGCTC ATCGAAGCAC TCACAGAGTG GGATGCGACG 
TACGCAACCG AACGTGGTGT GCCGACAGTC CTCCTCGCCG AAGACGATCC GCGCCTGCGA 
GAGCTCTATG CACTGTGGTT GCAAACCGAC TACGACGTAC TGACAGTCCC CGACGGTCAG 
ACAGCACTCC GCTCCCTCGA CGAGTCAGTC GACGTGGCAG TCCTCGCTCG CGATCTGCCG 
ACACTCGACG GGGCCGCGGT CGCAGCCGCA CTCGAGACGG CCGGGCAGCG AACGCCGGTC 
GCGATCATCA CGTCGGCAGA CATCTCGCCG GAGGACGTCT CGATCTCGGC AGATCTGTTA 
GTTCGAGATC CGCTCTCCAA AGCCGAGTTG ATCGACACCG TCGAACAGCT CACACGGCTT 
CCGAAGGAGT CACCGATTGG CCGGGATATT CGTGCTCGCC GCCATCGGCT GGCGTTCGTC 
GAGCGCCACC TCGGGCCGAC GGTCTCAGAG ACGGAGCCCT ATCAGCGGGC TGCGGACGAA 
CTGACGGCAC TCGAGCAGGA ACGAGAGCGG ACAGCCGACG CGAGAGCGCC GTGGCGGCGG 
CTGAGACGGG GAAACGGAGC GGAGTCGGAT GCGTCGGGTC GAGCAAAGCG GCGTGAATAC 
GAAGCGCGGG AGCGGGGACA GGCGAATCAA GAACGAGAAC GAGCACAAGC ACAAAAACGG 
AACCGAGACC GAGAGCGAAA ACGCGACCGC AACTCCAAAC GAGATCGGGC GGCTGAGAAA 
GACCGCGATC ACAACCGAAC CCACGACGAC AGTGACGGGG ATGGGAACGA ATGA

Protein sequence

MSHPPTPAES TALSILGTKW KPRLIVALAT NDRLSFGDLK RELTGISGKV LSENLDELRD 
HGVVSRDVVQ QQPRRVEYEL TGAGRELYQL IEALTEWDAT YATERGVPTV LLAEDDPRLR 
ELYALWLQTD YDVLTVPDGQ TALRSLDESV DVAVLARDLP TLDGAAVAAA LETAGQRTPV 
AIITSADISP EDVSISADLL VRDPLSKAEL IDTVEQLTRL PKESPIGRDI RARRHRLAFV 
ERHLGPTVSE TEPYQRAADE LTALEQERER TADARAPWRR LRRGNGAESD ASGRAKRREY 
EARERGQANQ ERERAQAQKR NRDRERKRDR NSKRDRAAEK DRDHNRTHDD SDGDGNE