Gene Htur_2110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_2110
Symbol
ID	8742710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	-
Start bp	2179654
End bp	2180973
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	62%
IMG OID	646512692
Product	alpha amylase catalytic region
Protein accession	YP_003403666
Protein GI	284165387
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGACG ATACCGATCG ACGATCCGGT GACGGAATCG ACGACGCGAT GAGTAGACGA 
GCCCTCATCA GCACCGCCGC GATGGCCGGT GTTTCCCTCA CCGGCGTCGG GTCCGCCTCG 
GCGGGCACGG GCAGCGGCGA ACGGGTGTTC TTCCAGTACT TCCACGAGAC GTGGCCGACG 
ATCACGGACA CCCTCTCGAC AGTTGCGGAC CGCGGCTACG ACGGCGTCTG GATCCAGGCG 
CCTCAAGAGA GCGAGCTGAC CTGGAGCGAC CAGGACGGCC GGAACGATCC GCCGTTGGGC 
TACCAGCCGG TCGACTTCCG CTCCTTCGAC AGCGAGTTCG GGACCGAAGC GGACCTCAAC 
CGGCTCGTCG AGACCGCACA CGAACACGGC CTCGAGGTGT ACGTCGACTG CGTAATGAAC 
CACATGGCCG CAAATCGCGG CTACGACTTC CCGCAGTTCA AGGAGAAACA CTTCCACACT 
CACGTCGGTT CGATCGACGA CTGGGACGAC GAACACCAGG TCGAGCACGG GAACCTCCTC 
GGGTTGAAGG ACCTCGCGCA ACTCGAGGAC CACGGACACG AGGACACCGC GCCGTACGTC 
CGCGAGCAGC TGTACGACTA CATGAAAAAG ATCGCGGACA CCGGGGCCGA CGGCTACCGC 
TACGATGCGG TCAAACACGT CGAGCGCGAA TACTGGGAGC AGTACGCCAA TCAGTGGGCT 
GACGAGTTCG GCATGAGTCG AGTCGGAGAG GTGTTTGACG GCGGCGTCGA CTACGTGCAG 
AACTACATCG ATACCGGAAT GAACGCCTTC GACTACCCGC TGTACTTCGT CATGGAGGAG 
GTCTTCGACT ATGGTGATAT GAGCAAACTC GACGGTGCGG GAGTTGTCGC CCAGGATCCG 
TTCCACTCTT GGCCGTTCGT TCAGAATCAC GACGAGGGCG CGCCGCCACA GTACCACCTC 
GCACACGCCT TCGTTCTCAC GATCGAGGGA ACGCCGATGG TATACAATCT CTACCCCGAC 
GAGATCCTCG ACGACGACGC GATCACCAAC ATGGTGTGGG TCAAGACGAA CCTCGCCGGC 
GGTACGACCT ACTGGCGACA CACCGATTCC GACCTCGCAG TCTACGAGCG GCAGAACAAC 
CTGCTCGTCG GTCTCAACAA CAATACCGAC AGCTGGCGAA GTAAGTGGGT GTACACGACC 
TGGAGCGACG AGACGCTCAA AGACTACAGT GGCAACGCCG ACGACATCGA CGTCAACGGT 
GACGGCTGGG TCGAGGTCTC GGTTCCGCCC GAGGGGTGGG TGTTCTACGC GCCGTACTGA

Protein sequence

MSDDTDRRSG DGIDDAMSRR ALISTAAMAG VSLTGVGSAS AGTGSGERVF FQYFHETWPT 
ITDTLSTVAD RGYDGVWIQA PQESELTWSD QDGRNDPPLG YQPVDFRSFD SEFGTEADLN 
RLVETAHEHG LEVYVDCVMN HMAANRGYDF PQFKEKHFHT HVGSIDDWDD EHQVEHGNLL 
GLKDLAQLED HGHEDTAPYV REQLYDYMKK IADTGADGYR YDAVKHVERE YWEQYANQWA 
DEFGMSRVGE VFDGGVDYVQ NYIDTGMNAF DYPLYFVMEE VFDYGDMSKL DGAGVVAQDP 
FHSWPFVQNH DEGAPPQYHL AHAFVLTIEG TPMVYNLYPD EILDDDAITN MVWVKTNLAG 
GTTYWRHTDS DLAVYERQNN LLVGLNNNTD SWRSKWVYTT WSDETLKDYS GNADDIDVNG 
DGWVEVSVPP EGWVFYAPY