Gene Hoch_2211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2211
Symbol
ID	8544597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	3072326
End bp	3073921
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	72%
IMG OID	646386918
Product	phytoene desaturase
Protein accession	YP_003266649
Protein GI	262195440
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1233] Phytoene dehydrogenase and related proteins
TIGRFAM ID	[TIGR02734] phytoene desaturase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.931782
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.130578
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAACC CCGCGCAAGC GACCCGCGCC GCCGTCATCG GCAGCGGCTT TGGCGGCCTC 
GCCGCCGCCA TCCGGCTGCA GACCGCCGGC ATCCAGACCA CCCTGTTCGA GGCCCGCGAC 
AAACCCGGCG GCCGCGCCTA CGTGTACCAG CAGGACGGCT TCACCTTCGA CGGCGGGCCC 
ACCGTCATCA CCGCCCCGCA CTGCCTCGAG GAGCTGTTCA GCGAAGCCGG CCGCGACCTG 
GCCGACTACG TCGACATGCT GCCCGTGCAC CCCTTCTATC GCCTGGTCTG GTCCGACGGC 
GACAGCTTCG ACTACACCGG CGACAGCGCC AGCATGGAGG CCCAGATCCG CGCCCGCAAC 
CCGGCCGACG CCGAGGGCTA CCGGCGCTTC GTCGAGTACA GCAAGGAGGT CTTCGAGATC 
GGCTACGAGC AGCTCGTGGC CACGCCCTTC CTGCGGTTCT CGGACATGGT GAAGGTCGCC 
CCGCAGCTCG CCCGCCTGCG CGCCGACCGC TCGGTCTACA GCGCCGTGGC CCGCTTCGTC 
GAGGACGAGC ACGTGCGCCA GGCGCTGAGC TTCCACGCCC TCCTGGTCGG CGGCAACCCC 
TTCGAGACCA GCGCCATCTA CACCCTCATC CACTACCTCG AGCGCAAGTG GGGCGTGTTC 
TTCCCGCGCG GCGGCACCGG CGCCCTGGTG CAGGCGCTGG TGAAACTCTT CGAAGAGCTC 
GGCGGCGAGC TGCGCCTGTC CACCCCGGTG CGGCGCATCG ACCTGCGCCA GAGCCAGGGC 
CGCACCGTGC ACCGCGTGAC CACCGACGCC GCGCTCGCCG AGCCCTTCGA CCTGGTGGTG 
TCCAACGCCG ACCTGCACCA CACCTATTCC ACCCTCTACG CCGACCAGCC CGGCGCCGCC 
CGCACCGCGC GGCGGCTGGC CAAGATGGAC TGGTCGATGT CGCTCTTCGT CCTGTACTTC 
GGCACCGACC GCCCGTACCG CGACGAGGTC GTGCACCACA CCGTGGTTTT CGGACCGCGG 
TACCGCGAGC TGCTCGACGA CATCTTCCAC GGCCACGAGC TGCCCGAGGA TTTCAGCCTG 
TATCTGCACG CGCCCACGCA CACCGACCCG TCCCTGGCCC CCGAGGGCTG CGGCGCCTTC 
TACGTGCTGT CGCCGGTGCC GCACCTGGGC AACGCGCCCG TCGACTGGTC GCGCGTCGGC 
GCCCTGTACG CCGAGCGCAT CCTCACCGCG CTCGAGGACC TCATGCCGCG GCTGCGCGAG 
CACGTGGTCA CCAAGATGTG GATCACGCCC GACACCTTTC AGAGCGAGCT GCGCTCCTTC 
CAGGGCTCGG CCTTCTCGTG CGCGCCGCGG CTCACCCAGA GCGCCTACTT CCGCCCGCAC 
AACCGCGACC GCCGCATCCC GGGCCTGTAC CTGGTCGGCG CCGGCACCCA CCCGGGCGCC 
GGCGTACCCG GCGTGGTCAA CTCGGCCAAG GCCACCGTCG GCGTCGTGCT CGATGACCTC 
GGCCGCGGCG ACCGCGGCGG CCTCAGCGGC CGTGGCGGCC ACGGCGACCG CGGCGGTCGC 
GGCGACCGCG GCGGTCGCGG CGGAGCAGCC GCGTGA

Protein sequence

MSNPAQATRA AVIGSGFGGL AAAIRLQTAG IQTTLFEARD KPGGRAYVYQ QDGFTFDGGP 
TVITAPHCLE ELFSEAGRDL ADYVDMLPVH PFYRLVWSDG DSFDYTGDSA SMEAQIRARN 
PADAEGYRRF VEYSKEVFEI GYEQLVATPF LRFSDMVKVA PQLARLRADR SVYSAVARFV 
EDEHVRQALS FHALLVGGNP FETSAIYTLI HYLERKWGVF FPRGGTGALV QALVKLFEEL 
GGELRLSTPV RRIDLRQSQG RTVHRVTTDA ALAEPFDLVV SNADLHHTYS TLYADQPGAA 
RTARRLAKMD WSMSLFVLYF GTDRPYRDEV VHHTVVFGPR YRELLDDIFH GHELPEDFSL 
YLHAPTHTDP SLAPEGCGAF YVLSPVPHLG NAPVDWSRVG ALYAERILTA LEDLMPRLRE 
HVVTKMWITP DTFQSELRSF QGSAFSCAPR LTQSAYFRPH NRDRRIPGLY LVGAGTHPGA 
GVPGVVNSAK ATVGVVLDDL GRGDRGGLSG RGGHGDRGGR GDRGGRGGAA A