Gene Haur_1239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1239
Symbol
ID	5733147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1443142
End bp	1444236
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	50%
IMG OID	641278379
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_001544015
Protein GI	159897768
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCATTG CAGTTACCGG CGGGGCAGGC TTTATTGGCT CCAACTTTGT GCGATATTGG 
ATGGATACAA ATCCTGCTGA TGAGGTTGTG GTGATTGATG CCTTGACCTA TGCTGGCCAT 
CTGAGTAATT TGGCAGGCTA CCACGAACGC GCCAATTGCC AATTTGTGCA GGCTGATATT 
TGCGATTACC CAACCATGCT CAAGGTATTG GCGGGGGTCA ATTTGGTAGT ACACTTTGCC 
GCCGAAACCC ACGTTGATCG CTCGTTGGGT GAGTTTGAAA TGGAGCGTCA ATTTTATCGC 
TCGAATATCG AAGGTACTGC CAGCTTACTA CGAGCTTCCC GCGAGGCTGG AGTTGGGCAT 
TTTCACCATG TTTCGACCGA TGAAGTGTTT GGCGATTTAG ACTTTGATGA TCCGCAAAAA 
TTCCACGAAA CCTATCCCTA TAATCCCAGC AGCCCTTATG CGGTCAGCAA AGCAGCCTCG 
GATCATGTGG TGCGAGCCTT TGCCCACACC CACAAATACC CAATCACCAT CACCAACTGC 
ACCAACAATT ATGGCCCATT CCAAACTCCT GAAAAGCTGA TTCCCCGTTC AATTGCCTTG 
TTACTGGCCG GCCAAAAAGT GAAGCTCTAT ACTGATGCCG AGGGCATTCC AGGCCGTAAC 
ATCCGCGATT GGTTGCATGT GCAAGATCAC TGTGAAGCGA TTGCTTTGGT GATTCAAAAA 
GGTCGGATTG GTGAAACCTA TGGGATTGGC GGCGAGGCCG AGCTTTCCAA CTATCACTTG 
GTCGAAACCA TGCTCGATAT TATGAGCGAA TATTTAGATC GCACGTTGAC AATTGAAAAT 
AGCGTCGAAT TTGTGGCTGA TCGCCCAGGC CACGACCGCC GTTATGCCAT GGATTTGAGC 
AAAATCAAGC GTGAGTTGGG CTGGCAGCCA CGTTATTCGT TCCAACAAGG CTTTTTAGAA 
ACCGTGCAAT GGTACACATC GCCCGAAGGT CAAGCATGGC TGGCAAGCTT GAACGATCGT 
ACCAGCGATG TCCGCGCCAA CCAAGAGCAA GTCGTTGCTG TGCGCGAAAA CTGGCAAGCT 
GAGCATCAAT CCTAA

Protein sequence

MRIAVTGGAG FIGSNFVRYW MDTNPADEVV VIDALTYAGH LSNLAGYHER ANCQFVQADI 
CDYPTMLKVL AGVNLVVHFA AETHVDRSLG EFEMERQFYR SNIEGTASLL RASREAGVGH 
FHHVSTDEVF GDLDFDDPQK FHETYPYNPS SPYAVSKAAS DHVVRAFAHT HKYPITITNC 
TNNYGPFQTP EKLIPRSIAL LLAGQKVKLY TDAEGIPGRN IRDWLHVQDH CEAIALVIQK 
GRIGETYGIG GEAELSNYHL VETMLDIMSE YLDRTLTIEN SVEFVADRPG HDRRYAMDLS 
KIKRELGWQP RYSFQQGFLE TVQWYTSPEG QAWLASLNDR TSDVRANQEQ VVAVRENWQA 
EHQS