Gene Htur_3042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_3042
Symbol
ID	8743661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	+
Start bp	3125475
End bp	3126578
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	70%
IMG OID	646513627
Product	sulphate transporter
Protein accession	YP_003404582
Protein GI	284166303
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCATT CGTTCCGGTC TGGGGCCGGC TCCGCGCTCG AGTTTTCGAC GGGCGAGCTG 
ACAGGAGCGC TAGGTGATTC GGTTACGGTA TTGCCGCTGG TAGTCGCGCT GGCGGCGACG 
ACGAGTGTCT CCCTGCCTCA CGTACTGGTC GGCTTCGGCG TCTTCCAGAT CGTCTGGGGA 
CTCTACTACG GACTACCGCT GTCCGTCGAA CCGATGAAGG CCTTGATCGG GCTGGCGATC 
GTCGGGACGC TCACCTATGT GGAACTCGCC GCCGCCGGCC TGGTAGCGGG GGGCATACTG 
CTCGCGGTGG GGAAACTGGG GCTCGTCGGC CGACTCCAGC GGGTCGTCGG CGAACCCGTG 
ATCCGCGGCG TACAGTTCGC CGTCGCCTTG CTCCTCCTCG AGGCGGCCGT CGACCTCTCG 
ACGGGGAACC TCCCGGTCGC GATCGGCGGG CTAGCCGTCG TCGGCCTGCT AGCGCTGGTC 
GGCTACCGGC AGGCCAGCGT GCTGGTCGTG CTCGGGCTCG GCGCCCTCAC GGCCGTCACG 
ACGACGGGAA TCCCGACACC GCAGGTGCCC GCTCTCGCCG TCTTCCCGGC GGGCGGGCCG 
ACCCTGTCTT CCGCCGCGCT CGAGGGGACC GTCGCACAGT TGGGGATGAC GGTCGGGAAC 
GCGGCGATCG CGACTGCCCT GCTCTGTGGC GATCTCTACG ACCGGGATAT CTCGCCAGAC 
GCGCTCTCGA CGAGTATGGG CGTGACCTGT CTGGCGGCGA TTCCGCTCGG CGGCGTGCCG 
ATGTGCCACG GCAGCGGCGG ACTCGCGGGG AAGTACGCCT TCGGCGCTCG CACCGGCGGT 
GCGAACGTGC TGCTCGGGGT CGGCTACCTC GCGCTGGCGC TCGTGGCCAC CGGGGCCCTG 
CTGGCCGCAT TCCCGCTTGC GGTTCTCGGC GTCCTGCTCG TCGTCGTCTC CCTCGAGTTG 
GCTCGAGCGG CGTTCGAGCC GGTCTCGGGC CGCCGTTCGC TGGCGTTCGT GCTGGGCGTC 
GGCGCCATCG GCCTGTTCAT CAACGTCGGC GTCGCGTTCG TCCTCGGCGC TGGCCTGTTC 
TGGGCGTTGG CTGGAGCGGA GTGA

Protein sequence

MAHSFRSGAG SALEFSTGEL TGALGDSVTV LPLVVALAAT TSVSLPHVLV GFGVFQIVWG 
LYYGLPLSVE PMKALIGLAI VGTLTYVELA AAGLVAGGIL LAVGKLGLVG RLQRVVGEPV 
IRGVQFAVAL LLLEAAVDLS TGNLPVAIGG LAVVGLLALV GYRQASVLVV LGLGALTAVT 
TTGIPTPQVP ALAVFPAGGP TLSSAALEGT VAQLGMTVGN AAIATALLCG DLYDRDISPD 
ALSTSMGVTC LAAIPLGGVP MCHGSGGLAG KYAFGARTGG ANVLLGVGYL ALALVATGAL 
LAAFPLAVLG VLLVVVSLEL ARAAFEPVSG RRSLAFVLGV GAIGLFINVG VAFVLGAGLF 
WALAGAE