Gene Htur_4403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_4403
Symbol
ID	8745031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013744
Strand	-
Start bp	674661
End bp	676139
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	63%
IMG OID	646514940
Product	sugar transporter
Protein accession	YP_003405887
Protein GI	284167609
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00879] MFS transporter, sugar porter (SP) family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.92249
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCTGA TTCACCGACT ATTGCCGGTA GGAGACGACG ATATCGGTCC GTTTGTTATC 
GTTATCTCCG CGCTCGCCGC GCTGAACGGA CTACTGTTCG GGTTCGACAC CGGCGTTATC 
TCGGGGGCGT TGCTCTACAT GTCCGAGACG TTCCCCCAAC TCGAGGCGAA CGCGTTCTTG 
CAGGGAACCG TCGTCAGCGG TGCGATGGTC GGCGCGATCG TCGGCGCGGC CTTCGGCGGC 
CGGCTCGCGG ATCGGATCGG GCGGCGCCGG CTCATCCTGC TCGGCGCCGT CCTGTTCTTC 
GTCGGGTCAT TCATCATGGC GGTCGCCCCC ACGGTCGAGA TTCTGATCCT CGGCCGACTC 
CTCGACGGGA TCGGGATCGG CTTCGCGTCC GTCGTCGGAC CGCTGTACAT CTCGGAGATG 
GCACCGGCGA AGATCCGCGG ATCGCTCGTG ACGCTCAACA ACGTCGCTAT CACGGGGGGA 
ATCCTCGTGT CCTACATAAC GAACCAGCTC ATCGCAAACA TGGCATTCGA CGCCGGCCTC 
TCGTGGCGGA TCATGCTCGG GCTCGGGATG CTCCCCGCCG TGGTCCTGTT CGGCGGGATC 
ATCTTCATGC CGGAGAGTCC GCGGTGGCTC GTCGAAAAGG ACCGAGAGCA GGAGGCTCGA 
TCCATCCTGA GTCGCGTCAG GAACGGCACT AACATCGATG CCGAAATGAA GGATATCATG 
CAGATGTCCA AGCGCGAGCA GGGGAGCTTT CGCGACCTCC TGCAGCCGTG GCTTCGCCCG 
GTCCTGATCG TGGGCCTCGG CCTCGCGATG TTACAGCAGG TCTCGGGAAT CAACGCGGTC 
GTCTACTACG CGCCGACGAT ACTGGAGTCG TCCGGATACA GCGACATCGC GTCCCTCTTC 
GGGACGATCG GAATCGGCTC GATCAACGTG TTGCTGACGG TCGCCGCGCT GTTCCTGGTC 
GACCGCGTCG GCCGTCGACC GCTGTTGCTC TTCGGCCTCG TCGGGATGTG TATCTCGGTG 
ACCGTCCTCG CCGGGGCCTA CATGGTTCCC AGCATGGGCG GGATCATCGG TCCGATTACG 
GTCGTGAGCC TCATGCTGTT CGTCGGCTTC CACGCGGTCA GTCTCGGCTC GGTCGTCTGG 
CTGGTCATCT CCGAAATCTT CCCGCTGAAC GTCCGCGGGG CCGCGATGGG AGTGACGACG 
TTGGTCCTCT GGTTCTCGAA CTTCCTCGTC GCACAGTTCT TCCCGTCGCT GTTCGAGATC 
GGCCCCACGG TCGCGTTCGG CGTGTTCGCG GGGATCGCGG CGGCCGGGTT CGTCTTCGTG 
TACGCGCTGG TCCCGGAGAC GAAAGGCCGG ACCCTCGAGG AGATCGAGGC CGATCTGCGC 
GAAACGGGCG TCGCCGACGA TAATCTGGCG CTCAGCGAGC AGGCCGAACA GGTCGATCCG 
ACTGAGCAGG TCGATCAGAC CGATCACGTC AACGACTGA

Protein sequence

MSLIHRLLPV GDDDIGPFVI VISALAALNG LLFGFDTGVI SGALLYMSET FPQLEANAFL 
QGTVVSGAMV GAIVGAAFGG RLADRIGRRR LILLGAVLFF VGSFIMAVAP TVEILILGRL 
LDGIGIGFAS VVGPLYISEM APAKIRGSLV TLNNVAITGG ILVSYITNQL IANMAFDAGL 
SWRIMLGLGM LPAVVLFGGI IFMPESPRWL VEKDREQEAR SILSRVRNGT NIDAEMKDIM 
QMSKREQGSF RDLLQPWLRP VLIVGLGLAM LQQVSGINAV VYYAPTILES SGYSDIASLF 
GTIGIGSINV LLTVAALFLV DRVGRRPLLL FGLVGMCISV TVLAGAYMVP SMGGIIGPIT 
VVSLMLFVGF HAVSLGSVVW LVISEIFPLN VRGAAMGVTT LVLWFSNFLV AQFFPSLFEI 
GPTVAFGVFA GIAAAGFVFV YALVPETKGR TLEEIEADLR ETGVADDNLA LSEQAEQVDP 
TEQVDQTDHV ND