Gene Msed_1081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1081
Symbol
ID	5104462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	1008839
End bp	1009999
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	50%
IMG OID	640506976
Product	sodium/hydrogen exchanger
Protein accession	YP_001191169
Protein GI	146303853
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0475] Kef-type K+ transport systems, membrane components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATATAA CCCTAGTTCT CCTGGAGATC TCAATACTCA TCTTCTTTGC TGAGCTCATG 
AGAACATCTC TTCGAAAGTT CGTTCCCTCC ATTGTTGGCG AGATCATAGC GGGAATGGTG 
TTAAGTCCCT TCGCTGTGGG AGGTCTACTG GATCACATCC TCAACCTAGA TCTGTTCTCC 
CTGAACCAAT ATCTCCTTTT CCTATCCGAG TTTTCCATGA TCCTCCTGAT CTTCTCCTCC 
GGACTGGAGC ATGGAGTCTC AGCGATCAGG TCAGCGGGAA CGTTTGGATT CCTGGGGGCA 
ACGGCAGGTG CACTTTTTCC CGCCCTAGTG GGGATACTGG TCTTTCAGGG AATAGGGTTT 
GACACGTCGC TCATCCTGGG AACTGCCATA GGTGCCACAA GCTTAGCCTC TGCTGGTTCT 
ATCATTTCTG AACTTAGGTT GAAAGGCAAA GGGGTTGATC TACTCATGTC CATGGCGTCA 
TCTGATGACG TTGTGGACCT AATCTTGCTC TCAGTGGTGC TGGGAACCCT GGCTGGGGCA 
ACATCTGTCA AGTCCATAGC GACGCTGGTG ATCTATTATA TAGTCGCCTG GATTGTGATA 
TTCGTGGTTG CCGTGAGGGT TATTCCCATG ATCGCTAACA GGTTGGACGA GGTATACATT 
GAGGAGTTCT CCATGTTAGT TATATTTGGG TTAACGGCCA TCATGACTGC CCTGAACTTC 
TCCCCCGTAA TTTCAGCATT CATTGCAGGA GTGGCCATGG CTGAGAGCGT GAAAAAGGAG 
AGGGTTAGGC AAATAATCGA CGTTCTTCTG GCGGTGTTCG GAAGTGCCTT CTTCGTAGTA 
GTGGGACTCC AGGTTAATCT GTCAGGTCTC ACCAATTTCT GGTTAATGGC AGTGGAGCTC 
ACTGTGATTG CTGTGATTTT CAAGATATTG GGAGTTTTAC CCTTTGCCTA CCTGGGATTG 
AGGAAGTGGA GAAGCGCGTT AGCCGTCTCC CTTGCCATGG TTCCGAGGGG TGAGACTGGA 
CTGGTTGTGG GATCCATAGG ACTAAGCTAT AACGCGCTCA ATCAGAACGA GTTCGGTGCC 
CTAGTTTTCA TGGCAATCCT AACCACTGTA ATTGGCGCCT CATTTTTCAA GGGTATGGCC 
CATTGGTTGA GGGAGGAATA G

Protein sequence

MDITLVLLEI SILIFFAELM RTSLRKFVPS IVGEIIAGMV LSPFAVGGLL DHILNLDLFS 
LNQYLLFLSE FSMILLIFSS GLEHGVSAIR SAGTFGFLGA TAGALFPALV GILVFQGIGF 
DTSLILGTAI GATSLASAGS IISELRLKGK GVDLLMSMAS SDDVVDLILL SVVLGTLAGA 
TSVKSIATLV IYYIVAWIVI FVVAVRVIPM IANRLDEVYI EEFSMLVIFG LTAIMTALNF 
SPVISAFIAG VAMAESVKKE RVRQIIDVLL AVFGSAFFVV VGLQVNLSGL TNFWLMAVEL 
TVIAVIFKIL GVLPFAYLGL RKWRSALAVS LAMVPRGETG LVVGSIGLSY NALNQNEFGA 
LVFMAILTTV IGASFFKGMA HWLREE