Gene Huta_2347 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_2347
Symbol
ID	8384646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	-
Start bp	2389985
End bp	2391724
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	67%
IMG OID	644973420
Product	dihydroxy-acid dehydratase
Protein accession	YP_003131246
Protein GI	257053413
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAACG ACGACAGGTT CTCGCGTGAC AAAGACGAGG ACCTTCCGAG CACCGACGTC 
ACTGAAGGAC CCGACAAGGC ACCCCACCGG GCGATGTTCC GCGCGATGGG CTACGACGAT 
GCCGACTTCG ACTCGCCGCT GGTGGGCATC GCCAACCCCG CTGCCGACAT CACGCCCTGT 
AACGTCCATC TCGACGACGT GGCCGAGACG GCCTGGGACG CCACCGACGA AGCGGGCGGG 
ATGCCCGTCG AGTTCGGGAC GATCACCATC TCCGACGCCA TCTCGATGGG CACCGAGGGG 
ATGAAGGCCT CCCTGATCTC CCGGGAGGTC ATCGCTGACT CCGTCGAACT CGTCGCGTTC 
GGCGAGCGCG TCGACGGCCT CGTCACCATC GGCGGCTGCG ACAAGAACAT GCCCGGGATG 
ATGATGGCGA TGATCCGGAC GGATCTACCG TCTGTGTTCC TCTATGGCGG CTCGATCATG 
CCCGGCGAGC ACGACGGGAG AGACGTCACC ATCGTCCAGG TGTTCGAGGG TGTCGGCGCC 
TACGCCACCG GCGACATGGA CGCCGACGAA CTCGACGACC TCGAACGCAA CGCCTGCCCC 
GGCGCGGGGG CCTGTGGCGG GATGTTCACC GCCAACACGA TGGCCTCCAT CTCGGAGGTC 
ATCGGGCTGG CACCGCTGGG CAGCGCAAGC CCGCCCGCCG AAGAGGAAAG CCGTTACGAC 
GTGGCCCGCG AGACCGGAGA ATTGGCCGTC GAAGTCATCG AAGAGCGCCG CCGACCGTCG 
GACATCCTCA CGCGGGAGTC CTTCGAGAAC GCCATCGCGC TGCAAACGGC GATCGGTGGG 
TCGACCAACG CCGTCCTGCA CCTGCTGGCG ATGGCCGCCG AGGCCGGCGT CGAGCTGGAC 
ATCGAGGACT TCGACGAGAT CAGCCGTCGG ACGCCGAAGA TCGCCGACCT CCAGCCTGGC 
GGCGAGAGCG TGATGAACGA CCTCCACGAG ATCGGCGGCG TCCCGGTCGT GCTCCGCCGG 
TTGCTGGAGG CCGACCTGCT GCACGGCGAT GCGATGACGA TCACCGGCCG GACGCTCGCC 
GAGGAGATCG AGCACTTAGA AGAGAAGGGG CGACTCCCGC CCGAGGAAGA GATCGACGCC 
GACTTCCTCT ACTCGATCGA CGACCCGAAG GAACCCGAGG GCGCGATCAA GATCCTGACG 
GGCAACCTCG CGCCCGACGG CGCGGTCCTG AAGGCGACGG GCAACGACGA GTTCTACCAC 
CAGGGGCCGG CGCGGATCTT CGAGGACGAG GAAGACGCAA TGGCGTACGT CCAGGAGGAT 
CGCATCGAGT CCGGCGACGT GATCATCATC CGCGGTGAGG GGCCCAAGGG TGGCCCCGGA 
ATGCGGGAGA TGCTCGGCGT CACCGCCGCC GTGGTCGGCC AGGGCCACGA GGACGACGTG 
GCGTTGCTGA CTGACGGCCG GTTCTCCGGC GGGACGCGCG GGCCGATGAT CGGCCACGTC 
GCCCCCGAGA GTTTCGTCGG CGGGCCGATC GGCGCGCTCG AAGACGGCGA CACCGTGACG 
GTGGACATTC CCGAGCGCTC GCTCGACGTT GACCTTAGCG ACGCGGAGAT CCAACAGCGT 
CTCGACGAGC GCGACGATCC CGAGCCGACC TACGAGAATG GTGTGCTGGC GAAGTACCAC 
CGGGACTTCG ACTCGGCGGC CAACGGTGCG GTGAGCAACC CCGGTGTCAA GCGGGAATAA

Protein sequence

MSNDDRFSRD KDEDLPSTDV TEGPDKAPHR AMFRAMGYDD ADFDSPLVGI ANPAADITPC 
NVHLDDVAET AWDATDEAGG MPVEFGTITI SDAISMGTEG MKASLISREV IADSVELVAF 
GERVDGLVTI GGCDKNMPGM MMAMIRTDLP SVFLYGGSIM PGEHDGRDVT IVQVFEGVGA 
YATGDMDADE LDDLERNACP GAGACGGMFT ANTMASISEV IGLAPLGSAS PPAEEESRYD 
VARETGELAV EVIEERRRPS DILTRESFEN AIALQTAIGG STNAVLHLLA MAAEAGVELD 
IEDFDEISRR TPKIADLQPG GESVMNDLHE IGGVPVVLRR LLEADLLHGD AMTITGRTLA 
EEIEHLEEKG RLPPEEEIDA DFLYSIDDPK EPEGAIKILT GNLAPDGAVL KATGNDEFYH 
QGPARIFEDE EDAMAYVQED RIESGDVIII RGEGPKGGPG MREMLGVTAA VVGQGHEDDV 
ALLTDGRFSG GTRGPMIGHV APESFVGGPI GALEDGDTVT VDIPERSLDV DLSDAEIQQR 
LDERDDPEPT YENGVLAKYH RDFDSAANGA VSNPGVKRE