Gene Haur_3869 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3869
Symbol
ID	5735718
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	4863142
End bp	4864188
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	54%
IMG OID	641281020
Product	hypothetical protein
Protein accession	YP_001546631
Protein GI	159900384
COG category	[I] Lipid transport and metabolism
COG ID	[COG3425] 3-hydroxy-3-methylglutaryl CoA synthase
TIGRFAM ID	[TIGR00748] hydroxymethylglutaryl-CoA synthase, putative

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTCAAC CTGAACGTCC AGTTGGGATC GTTGGGTATG GAGCATATGT TCCGCGCTAT 
CGAATTGCAG CCCAAGAGAT CGCTCGAGTA TGGGCCGCTG GCGAAGGAGC ATTGCCAATT 
ACATCAAAAA GTGTGCCTGG CCCCGATGAA GATACAATTA CCATGGCGAT TGAGGCAGGC 
CGGAATGCAC TCAATCGGGC GCAACTCGAC CCACAACAAT TAGCCGCTGT GTGGGTTGGC 
AGCGAAAGCC ACCCTTATAG TGTCAAGCCT AGCGGCACAT TAGTCGCCGA AGCCCTTGGC 
ACATCGCGCT GGATCAGCGC CGCCGATTGG GAATTTGCCT GCAAAGCTGG CACCGAGGCC 
TTGAGCGCAG GCATGGGCTT GGTTGGCAGT GGAATGGCTG ATTATGTGCT AGCGATTGGC 
GCTGATACGG CCCAAGGTCG CCCAGGCGAT GCTTTGGAAT ATACCGCTGC TGCCGCTGCG 
GGAGCGTTGA TCGTCGGGCC TGCTCAGCAA GCGCTAGCCA CTATTGAAGC AACCCTTTCG 
TATGTTTCTG ATACCCCTGA TTTCTTTCGC CGCGCTGATC GACCTTACCC GATGCATGGC 
AATCGCTTTA CCGGCGAGCC AGCCTATTTT CACCACGTTA GCACTGCTGC CAAGCAATTG 
TTGGCCGAAT TAGGTCGCAC TGCTGCCGAT TATCAATATG CTGTGTTTCA CCAACCGAAT 
GTTAAATTTC CGCAAACTGT TGCGAAACAG GTGGGTTTTG CTCCCGAACA ATGCCAAGCT 
GGTTTGTTGG CGGGCGAAAT TGGCAACAGC TATTCGGCAG CCTCAATGAT TGGCTTATGT 
GCTGTGCTTG ATGTGGCTCA AGCTGGCGAC CGGATTTTGC TGGCTTCCTA TGGCAGTGGA 
GCTGGCAGCG ATGCCTATTC GTTAGTGGTA ACTGAGGCTT TGGCGGCAGC TCGCAATTTA 
GCGCCACGCA CCAGCGCCTA TCTCAAACGT CGGCAATTAA TCGATTATGC CACCTATGCC 
AAGTGGCGCG GCAAAATTGT TGAGTAA

Protein sequence

MRQPERPVGI VGYGAYVPRY RIAAQEIARV WAAGEGALPI TSKSVPGPDE DTITMAIEAG 
RNALNRAQLD PQQLAAVWVG SESHPYSVKP SGTLVAEALG TSRWISAADW EFACKAGTEA 
LSAGMGLVGS GMADYVLAIG ADTAQGRPGD ALEYTAAAAA GALIVGPAQQ ALATIEATLS 
YVSDTPDFFR RADRPYPMHG NRFTGEPAYF HHVSTAAKQL LAELGRTAAD YQYAVFHQPN 
VKFPQTVAKQ VGFAPEQCQA GLLAGEIGNS YSAASMIGLC AVLDVAQAGD RILLASYGSG 
AGSDAYSLVV TEALAAARNL APRTSAYLKR RQLIDYATYA KWRGKIVE