Gene Hlac_1075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1075
Symbol
ID	7400147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1074358
End bp	1075506
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	66%
IMG OID	643708141
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_002565740
Protein GI	222479503
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGTCC TACTCACCGG TGCAGACGGG TACCTCGGAT GGCCGACCGC GCTTCGACTG 
GCAGACCGGC TCGACGAACG GATCGTCTGC GTCGACAACT TCGCGCGACG CAGTTGGGTC 
GCCGAGTCGG GGAGCGTCTC CGCGACGCGG GTCGAGAGCC CCGAGGAGCG ATTCGACGCG 
GTGGAGAACC TGAGTCTCGT GGAAGGCGAC CTGGCCGACC GCGACTTCGT ACTCCAGCTG 
TTGGAGACGT ACGAGCCGGA CACCGTGCTG CACGCGGCCG CGCAGCCGAG CGCGCCCTAC 
TCGTCGATCA ACGGCGAGCG CGCGCTGTAC ACCCAGCGGA ACAACGTCTC GATGAACCTC 
AACCTGCTCC ACGGGCTCGC CGAGTGCGGG CTCGACGACA CGCACTTCAT CGAGACGACG 
ACGACGGGCA TCTACGGCGC CCCGCACTTC CCGATCCCGG AGGGCGGGCT GGAGGTCGAG 
CGGAAAGACG GCAGCGACGA GGTCCCGTTC CCGGCGATGG GCGGGAGCTG GTACCACCAG 
ACGAAGTCGT TCGACGCGGC GAACATGCGG CTCGCGGAGT CGCAGTTCGA GTTCCCGATG 
AGCGAGGTTC GGACCGCGAT CGTGTACGGG ACGGAGACCG AAGAGACACA GGCGCACGAG 
AGCCCGACGC GGTTCGACTT CGACTACTAC TTCGGCACGG TCGTGAACCG CTTCTGCGCG 
CAGGCGGTCG CCGGCTACCC GATCACCGTC TACGGCAAGG GCGAACAGCG CAAGCCGATG 
GTGAGCCTCG AAGACACCGT CGAGAGCCTC GTCCGGCTCG TCGAGGAGGG ACACTCCGGC 
GACGACGGGA TCGACATCTA CAATCAGGTC ACCCGCCCGG TCGCCATCGT CGAGCTCGCG 
GAGACGATCG CCGAGGTCGG CGACGAGTTC GACCTCGACG CCGCGGTGAA ACACTACGAG 
AACCCGCGCA ACGAGGACGA GGAACACAAG ATGGAGATGG AGAACGACCG GTTCCTCGAT 
CTGGTCGGCG GACAGCAGCA GACCTTGGAA GAGGGGATCC GCGATGTGCT CGGAACGCTC 
GTCGACGAGC AGGACCGGAT CGCGGCCCAC GAGGACCGGT TCCTGCCCGG CGTGTTGACT 
GATGAGTGA

Protein sequence

MTVLLTGADG YLGWPTALRL ADRLDERIVC VDNFARRSWV AESGSVSATR VESPEERFDA 
VENLSLVEGD LADRDFVLQL LETYEPDTVL HAAAQPSAPY SSINGERALY TQRNNVSMNL 
NLLHGLAECG LDDTHFIETT TTGIYGAPHF PIPEGGLEVE RKDGSDEVPF PAMGGSWYHQ 
TKSFDAANMR LAESQFEFPM SEVRTAIVYG TETEETQAHE SPTRFDFDYY FGTVVNRFCA 
QAVAGYPITV YGKGEQRKPM VSLEDTVESL VRLVEEGHSG DDGIDIYNQV TRPVAIVELA 
ETIAEVGDEF DLDAAVKHYE NPRNEDEEHK MEMENDRFLD LVGGQQQTLE EGIRDVLGTL 
VDEQDRIAAH EDRFLPGVLT DE