Gene Haur_1802 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1802
Symbol
ID	5733704
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	2091069
End bp	2092256
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	55%
IMG OID	641278945
Product	isochorismate synthase
Protein accession	YP_001544573
Protein GI	159898326
COG category	[H] Coenzyme transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1169] Isochorismate synthase
TIGRFAM ID	[TIGR00543] isochorismate synthases

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGTT TTGAACAAGA ACGGCTACGC GAATCGGCGT GGCAATTGCT AGACAACTAT 
CAAGCAGAAT CGGCCTTTTT CTTTGCATCG CCCAATCATA CCTTGTTGGG CCAATTAAGC 
TATGTTGATT TGATCAGCCA AACCGCCTTG CTTGAGCTTG AGCAACGAGT TAACGAGGCG 
CTGCAACGGG CTGAACGTGG TGGTGAAGTT AATCCAGTCG TGGTTGGGGC ATTGCCTTTT 
GCTCCCGATG CGGCGGCTTA TTTGGCCTTG CCATCGCGGG TGGTTTGGGC TGGCCCATTG 
CACGCCGAAG CCCAACCCTA TTGGCATAAC CAGCGTTTGC CGCATTGCAG CATCGAGCCA 
ATGCCAGCGC CCGAACACTA CAAACAGGGT GTGGCTCAAG CCTTGGCCAA AATGCAGGCT 
GGCGATTTGC AAAAAGTTGT GCTCTCACGC TCGTTGCAAT TGACCGCCGA AGCACCGCTT 
GATGTGAATT TGATTCTGGC GAATTTGGCA CGTAACAACA AAACTGGCTA TACCTTTGCG 
GTGCCGTTGC CAACCCGCCG CGCGTTGGTT GGGGCTAGCC CTGAATTGTT GCTGGCGCGT 
AATGGCAATC AAGTGATCGC CAATCCCTTA GCTGGTTCGA TTCCGCGCAG CGCCGACCCT 
GAAGAAGATG CGCGGCGGGC AGCAGGTTTG CTCGAATCGC CCAAAGATTT GCATGAACAT 
AAGGTTGTAA TTGAGGCGGT TGCGGCGGCC TTAGCGCCAT TCTGTCTGAG CCTTGATGTG 
CCGCAACCAA CCGTTATTTC CACCGCGACG ATGTGGCATC TCTCAACAAC CTTGGTTGGC 
GAATTAAAGC CTGATGCACC TTCATCGTTG GGTTTGGCAT TGGCCTTGCA CCCAACTCCA 
GCGGTCTGTG GTACGCCTAC CGAGGTCGCC CGCGCCGCCA TCCGCGAAAT CGAGCCGTTT 
GATCGCGGCT TTTTCACGGG GATGGTTGGT TGGTGCAACG CCCAAGGCGA TGGCGAATGG 
ATTGTGACGA TTCGTTGTGC CGAAGTTGTT GATCAATCGT TGCGTTTATT TGCTGGTGCT 
GGGGTGGTAC TAGGCTCGAC TCCTGAAGCC GAGTTGGCCG AAACTGCGGC GAAATTCCGC 
ACGATGTTGT TGGCGATGGG CATCGATAGC GAAGGCGAGG TGGCCTAA

Protein sequence

MSSFEQERLR ESAWQLLDNY QAESAFFFAS PNHTLLGQLS YVDLISQTAL LELEQRVNEA 
LQRAERGGEV NPVVVGALPF APDAAAYLAL PSRVVWAGPL HAEAQPYWHN QRLPHCSIEP 
MPAPEHYKQG VAQALAKMQA GDLQKVVLSR SLQLTAEAPL DVNLILANLA RNNKTGYTFA 
VPLPTRRALV GASPELLLAR NGNQVIANPL AGSIPRSADP EEDARRAAGL LESPKDLHEH 
KVVIEAVAAA LAPFCLSLDV PQPTVISTAT MWHLSTTLVG ELKPDAPSSL GLALALHPTP 
AVCGTPTEVA RAAIREIEPF DRGFFTGMVG WCNAQGDGEW IVTIRCAEVV DQSLRLFAGA 
GVVLGSTPEA ELAETAAKFR TMLLAMGIDS EGEVA