Gene Htur_3895 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_3895
Symbol
ID	8744523
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013744
Strand	+
Start bp	132719
End bp	134146
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	67%
IMG OID	646514479
Product	glycoside hydrolase family 4
Protein accession	YP_003405426
Protein GI	284167148
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1486] Alpha-galactosidases/6-phospho-beta-glucosidases, family 4 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.206792
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATCGAC TCGAGGAGAG AGTGCCGTCG CGGTCGCGTT CGTCGGTGAA GATCGGCTAC 
GTCGGCGGCG GCAGTCACGG CTGGGCGCAC ACGCTCATCA ACGACCTGCT CCAGTGCGAC 
GATCTCGCGG GGACGGTATC GCTCTACGAC GTCGACTACG AAGCGGCCGA GCAGAACGCG 
AGGCTGGCGA ACGGCCTCGC GGAGCGGTCG GACGCCAACG GGGCGTGGAC GTTCGAGGCG 
CGTCGGGAGG TCGACGACGC GCTCGCGGAC GCCGACTTCG TCATCTGCTC GATTCAGGAT 
CCGGTCGGGG AGACGTTCGT CCACGACATC GACGTCCCCC AGGAGTACGG CATTTACCAG 
ACCGTCGCGG ACACGGTCGG CCCCGGCGGC GTCCTGCGCT CGCTGCGAGC GATCCCGCAG 
TACCGCGAGA TCGCGGCGAC GGTCCGCGAA CAGTGTCCCG ACGCGTGGGT GATCAACTAC 
ACGAACCCGA TGACGGTCTG TACGCGGGCG CTCTACGAGG AGTTCCCCGA CATCAACGCG 
ATCGGGCTCT GCCACGAGGT GTTCGGTACC CAGCGGCTGC TGGCCGACAT CGCCGAGCGC 
TACGTCGACG AGGCCGAAGA CGTCGCGGCC GACGAGATCG ACGTGAACGT CAAAGGGATC 
AACCACTTCA CGTGGGTCGA CGAGGCCTAC TGGAACGGAC ACGACCTCTT CCAGTATCTC 
GATCGCGAAC TCGAGGAGCG GAAACCGATT CCGGGGTTCG AACCCGGCGA ACTGAACGAC 
GAGTCCTACT GGACGAACCA CCACCAGATC GCCTTCGATC TGTACGACCG GTTCGGGGTG 
CTCGGCGCGG CGGGCGACCG CCACCTCGCC GAGTTCGTCC CCTGGTATCT CGACATCGAC 
GAGCCCGAGG AGATCCAGCG CTGGGGGATC CGGCTGACCC CCAGTTCCGC CCGGACCGGC 
GACAGCGAGG GGCCGGCGAA GATGGAACGA TACCTGTCCG GCGACGAGGA GTTCGAGTTC 
ACCGAGTCCG GCGAGGAGGT CGTCGATATC ATGCGCGCGC TCGAGGGACT CGAGCCGATC 
AAGACGCACG TCAACCACCC GAATCGGGGC CAGACGCCCG ACCTGCCGAC GGGCGCCGTC 
GTCGAGACCA ACGCCGTCAT CACCGGCGGC GGCGTCGCGC CGATCACCGC CGGCGAACTC 
CCCCGCGAAG TGCGGTCGAT GGTACTGACG GCCGTGCACA ACCAGGAGAC GCTTATCGAG 
GCCGGCTTCG CCGGTGATCT GGACCTTGCC TTCCAGGCGT TCCTCAACGA ACCGCTGGTC 
ACCATTCAGC GCGACGAGGC CCGCGACCTG TTCGCCGACC TCGTCGCCCT CGAGCGCGAC 
TACCTCCGGG ACTACGACCT CGAGAACGCC GACGTCCTCG AGGGCTGA

Protein sequence

MHRLEERVPS RSRSSVKIGY VGGGSHGWAH TLINDLLQCD DLAGTVSLYD VDYEAAEQNA 
RLANGLAERS DANGAWTFEA RREVDDALAD ADFVICSIQD PVGETFVHDI DVPQEYGIYQ 
TVADTVGPGG VLRSLRAIPQ YREIAATVRE QCPDAWVINY TNPMTVCTRA LYEEFPDINA 
IGLCHEVFGT QRLLADIAER YVDEAEDVAA DEIDVNVKGI NHFTWVDEAY WNGHDLFQYL 
DRELEERKPI PGFEPGELND ESYWTNHHQI AFDLYDRFGV LGAAGDRHLA EFVPWYLDID 
EPEEIQRWGI RLTPSSARTG DSEGPAKMER YLSGDEEFEF TESGEEVVDI MRALEGLEPI 
KTHVNHPNRG QTPDLPTGAV VETNAVITGG GVAPITAGEL PREVRSMVLT AVHNQETLIE 
AGFAGDLDLA FQAFLNEPLV TIQRDEARDL FADLVALERD YLRDYDLENA DVLEG