Gene Hore_20680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_20680
Symbol
ID	7314392
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2237364
End bp	2238350
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	44%
IMG OID	643612512
Product	UDP-glucose 4-epimerase
Protein accession	YP_002509808
Protein GI	220932900
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1087] UDP-glucose 4-epimerase
TIGRFAM ID	[TIGR01179] UDP-glucose-4-epimerase

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATAC TGGTGACAGG AGGAGCCGGT TATATTGGGA GTCATGTAGT GAAAAGCCTG 
TTTGAGGCTG GTTATAATGT TGTTACCCTG GATAATCTTG AGAAGGGTCA CCGGGAAGCT 
GTCCTGGGCG GTGAGTTTAT TAAGGGTGAT CTCAAGGACA GAGAGCTGTT AGACAGCATA 
ATGAAAGATT ATGAAATAGA TGGTGTCATT CATCTGGCTG CCCACAGTCT GGTAGGAGAG 
TCAATGGAAA ACCCGGGGAA GTATTATAAA AATAATGTTT CCAATGGCTT AAATTTACTG 
GAAGCTATGG TTGATAATGA TGTGAAATAC CTGGTTTTTT CTTCTACAGC TGCAGTTTAT 
GGGGAACCCA GGGAAGTCCC CATCACAGAA GATCATCCAA CAGCTCCGAC AAATACCTAT 
GGGGAGAGTA AACTCTTTTT TGAAAAGATG ATGAAACGGT ATGATGAAAT TTATGGACTT 
AAGTATGTAT CCCTCCGTTA CTTTAATGCA GCCGGGGCCG ATCTATCAGG TAAAATTGGG 
GAAGACCATG ACCCTGAGAC CCATTTGATT CCCATTGTAC TTCAGAAAGC ACTGGGTTTA 
CGGGATAAGC TATATATTTT CGGGAATGAT TACCCGACCA GGGATGGAAC TTGTATCCGG 
GATTATATCC ATGTCAATGA CCTGGCTGAT GCCCATGTCC TGGCTATTGA AGGTTTAACA 
CGGGGTCTGG AGAGCCGTAT TTATAACCTT GGTAATGGTG AAGGTTATTC TGTAAAAGAG 
GTAATTGAAA CTGCCAGCAG GGTTATCGGC AAACCGATTG AAGCCGGGGT TGGTGACAGG 
CGACCCGGGG ATCCAGCTGT TCTGGTGGCA AGTTCAGATA AAATTAAAGA GGAGCTGGGA 
TGGGATCCAC AGTATCCTGA CCTGGAAACT ATAATTGAAA CTGCCTGGCA ATGGCATAAA 
AGGGGTGGTT TTAATGAAAA TGAATAA

Protein sequence

MNILVTGGAG YIGSHVVKSL FEAGYNVVTL DNLEKGHREA VLGGEFIKGD LKDRELLDSI 
MKDYEIDGVI HLAAHSLVGE SMENPGKYYK NNVSNGLNLL EAMVDNDVKY LVFSSTAAVY 
GEPREVPITE DHPTAPTNTY GESKLFFEKM MKRYDEIYGL KYVSLRYFNA AGADLSGKIG 
EDHDPETHLI PIVLQKALGL RDKLYIFGND YPTRDGTCIR DYIHVNDLAD AHVLAIEGLT 
RGLESRIYNL GNGEGYSVKE VIETASRVIG KPIEAGVGDR RPGDPAVLVA SSDKIKEELG 
WDPQYPDLET IIETAWQWHK RGGFNENE