Gene Haur_3139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3139
Symbol
ID	5735011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	3966510
End bp	3967886
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	50%
IMG OID	641280282
Product	UDP-glucose/GDP-mannose dehydrogenase
Protein accession	YP_001545904
Protein GI	159899657
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1004] Predicted UDP-glucose 6-dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00749895
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATCG TCGTTGCAGG AACAGGCTTT GTGGGATTGC CCCACGCTGC GGTCTGCTCA 
GAATATGGTC ATGAAGTCTA TGCCTATGAT ATTGATACGA AGCGGATTGC GGCTTACAAA 
ACCGCCAAGC GCGAAGAAAT TGAAAAATAT GTCAATGAGC CAGGCTTGGC CAGCATTATC 
CAAGAAAATA TCAACCGTTC TCTGCATTTC ATTGATGATC TTGAGCCGGT AATCGAAGGG 
GTCGATGCCT TTTTCTTGTG TTTGCCAACC CCGCCAAATC GCGATGGCTC CTCGAATTTG 
AGCTACTATT TCGATGCTGT CAATCATTTA GCGAAGTTGT TGGCTAAACG TGCTGATCAA 
CGCCGCGTGG TGATTATCAA TAAGAGCACA GTGCCAGTTG GCACTGGCCG CCAACTTGAG 
GAAGTGCTCA AAAGCCATAA TGTGCCAAAC GTGGGGATTG CCTCGAACCC TGAATTTTTG 
CCCGAAGGCA ACGCGGTTGA AAAATCGCGC CATCCTGATC GGGTCGTGGT TGGGGCTGAT 
ACCGAGGAAG ATTTCCGGAT TTTGCGCCGG ATCTACTCGC AATTTATCAA CCATGTGCGA 
ATTGCCTTTA TCGAAACCAC CCCTGAAACT GCTGAATCGA TTAAGTATGT CGCCAATACC 
TTGTTGTTGA CCTACATTTC ATTCTGGAAC GGGGTTGGCG GACGTTTGGC TGAATCGGTC 
TCAAATGTGC GCATGGAAGA TCTCAAGCGT GGCGTAACCG CCGATACCCG CATTAGCAAA 
TGGGGTTCGT TCGTCTCGAA CGGCGCTGGT GGCTCGTGCT TTGGCAAAGA CATTCAATCG 
TTGATCTATC AACTTAAGAG CCGCAACCAA AGCACCGATT TGCTCGAATC GGTCTATGAA 
ATTAACGAAT ACCAAAAGAC CTATTTGATC GATCGGGCAG CGGCCGAAGC TGGCGTGAAG 
TTTAACAATA AAGTTGTGGC ATTGTTGGGC TTGGCCTTCA AACAACGCAC CAACGATATG 
CGCGATGCCT CAGCCTTGAA AGTTGTCGAA AGCTTGCTTG GCCGTGGGGT CAAGGAAATT 
CGCGCCTACG ACCCAATGGC CGAAGAAGAA GCCAAGCGCT TTTTCAACCC CGAACACAAC 
CACTTGTTCG AGCGCATTAG CTACCACCCT TCGGCCAAAG CAGCGCTCGA AGGCAGCGAT 
ATGCTGTTTA TCTCGACCGA CTGGGAAGAA TTCCGCGGAC TTTCGAGCAC CATTGAAAGC 
ACCGTGCCAG CACCATACCT GATCATCGAT GGTCGCCGCA TGATTCCCGA CTACAATGAG 
TTGGTCGAAC GCGGCTATAG CTATTTGGCG GTTGGCTCAC CCTACTTGAA CAAATAG

Protein sequence

MKIVVAGTGF VGLPHAAVCS EYGHEVYAYD IDTKRIAAYK TAKREEIEKY VNEPGLASII 
QENINRSLHF IDDLEPVIEG VDAFFLCLPT PPNRDGSSNL SYYFDAVNHL AKLLAKRADQ 
RRVVIINKST VPVGTGRQLE EVLKSHNVPN VGIASNPEFL PEGNAVEKSR HPDRVVVGAD 
TEEDFRILRR IYSQFINHVR IAFIETTPET AESIKYVANT LLLTYISFWN GVGGRLAESV 
SNVRMEDLKR GVTADTRISK WGSFVSNGAG GSCFGKDIQS LIYQLKSRNQ STDLLESVYE 
INEYQKTYLI DRAAAEAGVK FNNKVVALLG LAFKQRTNDM RDASALKVVE SLLGRGVKEI 
RAYDPMAEEE AKRFFNPEHN HLFERISYHP SAKAALEGSD MLFISTDWEE FRGLSSTIES 
TVPAPYLIID GRRMIPDYNE LVERGYSYLA VGSPYLNK