Gene Hoch_2209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2209
Symbol
ID	8544595
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	3070133
End bp	3071287
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	72%
IMG OID	646386916
Product	lycopene cyclase
Protein accession	YP_003266647
Protein GI	262195438
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID	[TIGR01789] lycopene cyclase [TIGR01790] lycopene cyclase family protein

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.644027
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.133481
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGGACG CGACCTATCG ATACATCCTC GTCGGGGGCG GGCTGCAGAA CGGCCTGATC 
GCGCTGGCGC TGCTCGCTGA CGATCCCGGC GTCGAGCTGG CGCTGGTGGA GCAGGGGCCT 
GCACTCGGCG GCAATCACAC CTGGTGCTTT CACGCCGACG ACGTCCCCGC CGCAGCGCGG 
GCCTACGTCG ACGCGCTGGT GGCGCACCGC TGGGACGGCT ACGACATCGC CTTCCCCGAG 
CTCAAGCGCC GGCTCGACAC GCCCTACGCC GCGGTCAGCA GCGAGCGCTT CGATCAGGTG 
GTGCAAGCGC GGCTGCGGCG CGCGCCCGGG TGCGCGCTGA TGCTCGACAC CCGGGTCGAG 
GAGCTGAGCG CGCGCGGCGT GCGCCTGGCC GACGGTCGCA CGCTCTCGGG CGAAGTCGTC 
ATCGACGCGC GCGGCCCCGA GCGCACCCAG CTCGACGACA CCCGCACCGG CTACCAGAAG 
TTCGTCGGGC TCGAGCTGCG CCTGCGCGCG CCCCACGGCC GCGTGCGCCC CGTGCTCATG 
GACGCCACCG TGCCCCAGAG CGACGGCTTT CGCTTCTTCT ACACGCTGCC CTTCGGCCGC 
GATCGCCTGC TGCTCGAGGA CACCTACTTC TCCGACGCCG CCGCCCTCGA CGCCGACGCC 
ATCGAGCGCG AAGTCCTGGC CTACGCAGCC GCCAACGGCT ACCAGATCGC CGCCATCGAG 
CGCCGCGAGA GCGGGGTCTT GCCGCTGCCC TGGGCCGGCG ATGTGCGCGT CCCCGACCGC 
GGCCCCCTGG TAGCCGGCTA CCAGGGCGGC TTCTTCCACC CCGTGACCGG CTACTCCTTC 
CCCTTGGCCG TCCGGCTGGC CGAATACGTC GCCCACACCG CGCCCGGCGC GCTCTTTGGC 
CCTGGCCTGG CGCGCCTCCT GCGCGAGCAC GAGAAGCAGC TCCGCTTCGC CCATCGCCTC 
AACAAGATGC TCTTCTGCTG GTTCCCGCCG CATCTGCGCT ACCACGTCCT GGAGCGCTTC 
TACCGCCTGC CCGAGGCGAC CATTCGGCGC TTCTACGCGC TCGATCTCAC CGCCGGCGAC 
CGCGCGCGCA TCCTCGTCGG CCGCCCGCCC CGAGGGCTGT CGCTGCGGGC CGCGTTTTCC 
AAGAGGAGAG CCTGA

Protein sequence

MLDATYRYIL VGGGLQNGLI ALALLADDPG VELALVEQGP ALGGNHTWCF HADDVPAAAR 
AYVDALVAHR WDGYDIAFPE LKRRLDTPYA AVSSERFDQV VQARLRRAPG CALMLDTRVE 
ELSARGVRLA DGRTLSGEVV IDARGPERTQ LDDTRTGYQK FVGLELRLRA PHGRVRPVLM 
DATVPQSDGF RFFYTLPFGR DRLLLEDTYF SDAAALDADA IEREVLAYAA ANGYQIAAIE 
RRESGVLPLP WAGDVRVPDR GPLVAGYQGG FFHPVTGYSF PLAVRLAEYV AHTAPGALFG 
PGLARLLREH EKQLRFAHRL NKMLFCWFPP HLRYHVLERF YRLPEATIRR FYALDLTAGD 
RARILVGRPP RGLSLRAAFS KRRA