Gene Huta_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_1049
Symbol
ID	8383323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	-
Start bp	1015469
End bp	1016956
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	68%
IMG OID	644972114
Product	4-alpha-glucanotransferase
Protein accession	YP_003129965
Protein GI	257052132
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1640] 4-alpha-glucanotransferase
TIGRFAM ID	[TIGR00217] 4-alpha-glucanotransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCTTCG ACCGGCAAAG CGGCGTTTTC CTGCATCTCA CCTCGCTGCC CAGCCCGCAC 
GGGATCGGCG ACCTCGGTGA CGGCGCGCGG ACGTTTTTGG ACTTCCTGGA GCGTGCCGAG 
CAATCGCTGT GGCAGTTCTG TCCCGTCACG CCGACCCGTG GCGTCCACGG CCACTCGCCG 
TACGCCTCTC CCTCGGCGTT CGCCGGCAAC CCGCTCCTCG TCGACCTGAC CGCCCTCGTC 
GAACGGGGAT GGCTCGACGA GGAAACACTC GAGAACCCGC CGGGCGACCC ACGTACAGTC 
CAGTACGACA CTGTGACTGA TTTCAAGCGT GAACGTCTCA GCGCGGCCTT CGACGGGTTC 
GAGGCGAGCG CCGAGGCGGA CGACCGGGCG GCCTTCGAGG CGTTCCGTGA GCGCGAAGCC 
ACGTGGCTCA GGGACTATAC CCTGTTCACC GCGCTGAAAG CGGCCTACGA CGGGGTGCCC 
TGGCCCGAGT GGCCGGCCGA CCTCGCCGGA CGCGACCCTC CGGCACTCGA GGCCGCGCGG 
GAGACCCATG CCGAGGCGAT CCGGTATCAC GCGTTCGTCC AGTGGCTCTT CGACGAGCAG 
TGGCGCGCGC TGCGGGCGGC GGCCGACGAG CGTGGTATCT CACTCGTCGG CGACCTCCCG 
ATCTACGTCG CCTGGGACTC GGCGGACGTC TGGGCGAACC CCGAGGCCTT CGAACTCGAC 
GACGAGGGGG GGCCGACCGC GGTCGCGGGT GTCCCGCCGA ATCCCGGCGA CGATGGTCAG 
CGCTGGGGCA ACCCGGTCTA CGACTGGGAG ACGCTCCGGG CCGAGGACTA TGGCTGGTGG 
CGCGACCGGC TGGACCGACT GCTCTCGCTG GTTGATATCG CCCGCATCGA CCACTTCAAG 
GCCTTCGACG AGTACTGGGC CATCCCGGCC GACGCCGACG ACCCTGCCGC CGGCGAGTGG 
CGACCCGGAC CCGGCGCGGA CTTCTTCGAG ACGATCCGGG CCGAACTCGG GGAGTTGCCG 
TTCGTCGTCG AGGATCTGGG CTTTCTCGAC GAGAGCATGG TTGCACTCCG GGATCGCTTC 
GAGTTTCCGG GGATGCGCGT CCCGCAGTAC GCCGACTGGT GTCGGGAGGG CCACCGCTAC 
AAACCGACGG TCTATCCGGA CCACTGCGTC GGCTACACGT CGACGCACGA CACGGACACT 
GCGGTGGGAT TCTACGAGAA GCTCTCGGCC GAGCAACGCG ATTGCCTCGA ATACGCGCTG 
GCGACCGACG GGGATTCGAT CGCCTGGGAT CTGATCGAGG CCGTCTGGCA CTCCGACGCG 
GCCCTGGCGA TGACGACAGT GCCGGATCTG CTCGAACGCG GGAGCGATGC CCGACTGAAC 
CAGCCGGGTA CCGGCGAGGG CAATTGGACC TGGCGGGTGA CTGCCGACGA ACTCGACGCG 
GACACCGCTG ATCGGCTGGC AGCAGTCACG CGCGCGTCCC TCCGGTAG

Protein sequence

MSFDRQSGVF LHLTSLPSPH GIGDLGDGAR TFLDFLERAE QSLWQFCPVT PTRGVHGHSP 
YASPSAFAGN PLLVDLTALV ERGWLDEETL ENPPGDPRTV QYDTVTDFKR ERLSAAFDGF 
EASAEADDRA AFEAFREREA TWLRDYTLFT ALKAAYDGVP WPEWPADLAG RDPPALEAAR 
ETHAEAIRYH AFVQWLFDEQ WRALRAAADE RGISLVGDLP IYVAWDSADV WANPEAFELD 
DEGGPTAVAG VPPNPGDDGQ RWGNPVYDWE TLRAEDYGWW RDRLDRLLSL VDIARIDHFK 
AFDEYWAIPA DADDPAAGEW RPGPGADFFE TIRAELGELP FVVEDLGFLD ESMVALRDRF 
EFPGMRVPQY ADWCREGHRY KPTVYPDHCV GYTSTHDTDT AVGFYEKLSA EQRDCLEYAL 
ATDGDSIAWD LIEAVWHSDA ALAMTTVPDL LERGSDARLN QPGTGEGNWT WRVTADELDA 
DTADRLAAVT RASLR