Gene Haur_2104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2104
Symbol
ID	5733992
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	2630820
End bp	2632391
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	49%
IMG OID	641279245
Product	thioester reductase domain-containing protein
Protein accession	YP_001544872
Protein GI	159898625
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3320] Putative dehydrogenase domain of multifunctional non-ribosomal peptide synthetases and related enzymes
TIGRFAM ID	[TIGR01746] thioester reductase domain

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTAA TCAATAAGGT TAATAGTGCT GCGGCACTGC CGTTGCGCGA GTATCTTCAG 
CACCATTTGC CTGAGTCAAT GCTACCAACG GCATTTGTCG AACTTAGGCA GATTCCACGT 
TTGCCGAATG GCAAGGTTGA TCGGGCAGCC CTGCCAACTA TCGATTTTCA ACAATATAGT 
GATCCTGAGC ACTATGTTGC ACCGCGCACT ACCACTGAAC AGCAGCTTGC TTACATTTGG 
CAGCAAACCT TGCGTGTGCC ACAGGTGGGG ATTCACGATA ATTTCTTTGC CTTGGGTGGC 
GATTCGATTA CTAGTATTCA GGTGGCCGCG CGAGCCAATC AGGCTGGCAT TCGGCTGACA 
GCGCGTCAAT TATTTGAGCA ACCAACGATT GCCCAACTTG CTCATGGTGT CGCTATCACC 
GATCAGCGTA ATTTGCTCGA TGAAATTGTG CTTGATCCAG CAATCAATCC GCTTGGTCTA 
GCTCCCTATC ACGAGCACAT GCCCCAATCA ATCCTGTTGA CCGGGGCAAC TGGCTTTTTG 
GGGCCATATT TGTTGGCTGA ATTGCTCACA CAAACATCTG CCCACATCTA TTGTGTGGTA 
CGAGCCGCTG ATGAGACCCA AGCTTTTGCC AAAATTCGCC AACAGCTTGA ACATGCCAAT 
CGTTGGGAGC CAGCCTTTGC TTCACGGCTC ATCGTGATGC TTGGGGATCT GAGCCTTCCG 
CAGTTAGGCA TGACTGCGGC AGACTGGCAG ATGTTGGCTC AAACTATTGA TCGGATTTAT 
CACAATGGCG CAGTCGTAAA TCTGGCGCAT TCATATGCCC AACTCAAAGC TAGTAATGTG 
CAAGCAACCA TTGATTTGCT GCGTTTGGCA AGTCAAGTCA AGCTTAAATC AATGCACTTT 
AGTTCTACGA CCAGTGTTTT TCCAGCAAAC ACCGCTGCTA CAGTACGCTA TGAGCAAGAA 
CTGCCATCAA CACCAGATGG CCTCATCACT GGCTATGCCC AAACCAAGTG GGTTGCTGAA 
CACCTGTTGC TGCAAGCCCG CGCCCGCGGT ATTCCGATTA ATTGTTATCG GCCAGGCCGC 
ATTGGTTGGG ATACTCAAAC GGGTCAGTGG AATCGTGGTG ATGGTTTGTA TCGGTTGCTC 
CAAGGCTGTT TGCAGTTAGG TCGTGCGCCG TTGGTTGATC GGTTGGCTGA AATTACTCCG 
GTTGCTTATG TGGCCCAAGC GATGGTGGCG CTTTCGTTGC AGCCAAGCGG CCAAGGGCAA 
ACGTATCATT TGGTCAACCA ACAGCATATC GCTTGGAATC AACTGATTAA TTGGATGCAA 
GAACTTGGGT ATCCCATTGA ACAGGTTGAT CTTGATCAGT GGATGCTGCA ATTACAGCGG 
CAAACCAAGG ATGTACCAAA TACTTCTCTG CAATCACTGT TAACCTTAGC GCAAGCGGCA 
GTGAATGGCC CACATGCTGA GCAAGCCTAT GATCAAACTG CGATGCAAGC TGCGCTTGCA 
GCAACTGAGG TTATGCTACC AACGCTTGAT CGAACAAGCC TTCAACAATG GTTGGCACAA 
CTACGTTTTT AA

Protein sequence

MNLINKVNSA AALPLREYLQ HHLPESMLPT AFVELRQIPR LPNGKVDRAA LPTIDFQQYS 
DPEHYVAPRT TTEQQLAYIW QQTLRVPQVG IHDNFFALGG DSITSIQVAA RANQAGIRLT 
ARQLFEQPTI AQLAHGVAIT DQRNLLDEIV LDPAINPLGL APYHEHMPQS ILLTGATGFL 
GPYLLAELLT QTSAHIYCVV RAADETQAFA KIRQQLEHAN RWEPAFASRL IVMLGDLSLP 
QLGMTAADWQ MLAQTIDRIY HNGAVVNLAH SYAQLKASNV QATIDLLRLA SQVKLKSMHF 
SSTTSVFPAN TAATVRYEQE LPSTPDGLIT GYAQTKWVAE HLLLQARARG IPINCYRPGR 
IGWDTQTGQW NRGDGLYRLL QGCLQLGRAP LVDRLAEITP VAYVAQAMVA LSLQPSGQGQ 
TYHLVNQQHI AWNQLINWMQ ELGYPIEQVD LDQWMLQLQR QTKDVPNTSL QSLLTLAQAA 
VNGPHAEQAY DQTAMQAALA ATEVMLPTLD RTSLQQWLAQ LRF