Gene Htur_4659 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_4659
Symbol
ID	8745408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013745
Strand	-
Start bp	241014
End bp	242273
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	60%
IMG OID	646515168
Product	N-acylglucosamine 2-epimerase
Protein accession	YP_003406115
Protein GI	284172733
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2942] N-acyl-D-glucosamine 2-epimerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGACA TAGCTACGCT CAAGGAAGAG TATCTCTCGT CGCTCAAGCA AACGCTGACG 
GACAACGTCC TCGATTTCTG GTTCCCCCGC AGCATCGACG TTGAACACGG AGGGTTCATC 
ACCAGTTACG ACGAGCACGG CGAGTTCGCC GGCAACGACA ACAAACAGGT CGTCACACAG 
GCGCGCATGG TCTGGTTGGC AGCGCGGCTC GTCCGCGAAG GGTATGGCGA CGAGTACCGT 
GACATCGCCG ATCATGGGTT CGCATTTCTG GTCGACGAGC TGTGGGACGA ACCTAACGGC 
GGCTTCGTGT GGGAAGTCCG GCGCGACGGA ACCACGGTCA AACCAAACAA ACACCTGTAC 
GGACAGTCAT TCGGTCTCTA CGCGCTCTCC GAGTACTACC GCGCGACCGG GGACGACAAG 
GCAGCCGACT ACGCCCACGA GCTAGTCGAC TTGATGGACG AACACGCCAA AGACGGCGAG 
CACGGGGGGT ACATCGAGTA CTTCACGCCT GACTGGGAAC CGATCACGGA GGGACAGACA 
TACCTCGAAA ACATCGAACC GGACTGGTCG CCTAAGGAAT CAGGCGACAG CGTCCTCGAT 
CCGACGCTGA AGCTGATGAA TACGCATCTC CATCTCATGG AGGCGTTCAC GACCTACTAC 
GAGGCGTTCG ACACTAGTCG CGGACGGGAG CGCCTCCACG AACTACTAAC CATTCTCACT 
AACACGGTTT ACCGGAAGAA TCGCGGCTTC TGTACGGACA AGTATGATCC CGACTGGTCG 
CAGAAGCTCG ACGAGGAGTT TCGGGTCGTC TCGTACGGGC ACGATCTGGA GACCGTCTGG 
CTCGCAATGG AAGCCGCTGA CACGCTCGGC CACTCACAGG ACCTGTACCG GGAGTTCTTC 
AAGACGCTGT GGGATTACTC GCTGGAATAC GGGTACGACG AGGAGCGCGG CGGGTTCTAC 
TTCTATGGCG GCTTCGACGA ACCCGCAAGC TTCCGCGTCA AAGCCTGGTG GGTGCAGGCC 
GAGTGTATGA CCAGCGCTTT GCGAACCTAC GAGTGTACCG GCGACGACCG GTATCTCGAC 
GTCTTCGCCG ACACGTGGGA GTTCCTCGAC GACCATCAGA TCGACCGCGA ACACGGCGAG 
TGGCACTCCG GCATCAACGA CGATCTCGAA CCCGTCGGTC GCAAGGGCGC GGTCTACAAG 
GCGGCATACC ACAACGGTCG AGCGCTACTC GAGTGTATCG CAGCCCTCGA ACGGCTGTAG

Protein sequence

MADIATLKEE YLSSLKQTLT DNVLDFWFPR SIDVEHGGFI TSYDEHGEFA GNDNKQVVTQ 
ARMVWLAARL VREGYGDEYR DIADHGFAFL VDELWDEPNG GFVWEVRRDG TTVKPNKHLY 
GQSFGLYALS EYYRATGDDK AADYAHELVD LMDEHAKDGE HGGYIEYFTP DWEPITEGQT 
YLENIEPDWS PKESGDSVLD PTLKLMNTHL HLMEAFTTYY EAFDTSRGRE RLHELLTILT 
NTVYRKNRGF CTDKYDPDWS QKLDEEFRVV SYGHDLETVW LAMEAADTLG HSQDLYREFF 
KTLWDYSLEY GYDEERGGFY FYGGFDEPAS FRVKAWWVQA ECMTSALRTY ECTGDDRYLD 
VFADTWEFLD DHQIDREHGE WHSGINDDLE PVGRKGAVYK AAYHNGRALL ECIAALERL