Gene Haur_3870 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3870
Symbol
ID	5735719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	4864201
End bp	4865355
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	56%
IMG OID	641281021
Product	acetyl-CoA acetyltransferase-like protein
Protein accession	YP_001546632
Protein GI	159900385
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCAGG TTTTTATTGC AGGCACAGCT TGCACCGCCG TTCGCGAACA TTATGATCGT 
TCGTTGCTCG ATTTGGCCTT AGAGGCGCTG CATGGCGCGG TTGGTTCACT CGATCCAAGC 
TTAATTCAAG CGTTGTATGT TGGCAATGCG CTAGGCGATA CGCTGAGTGA GCAAAGCCAA 
TTGGGCGCGT ATATCGCTGG CGCGGCTGGC TTGAACTGCG AAGCGGTACG GGTTGAAGCG 
GCTGGTGCTA GCGGCGCATT GGCTTTGCGT CAAGGCTATT TGGCAATTGC CAGCGGCCAG 
GCTGATGTGG TGGTCGTGCT AGGCGTTGAA AAGGCCACTG ACAAACTCGA TGCTGCTTTG 
CAGGCTGCCT TGGCCTTGGG CTTGGATGGC GAACTTGAAC GGGCACTTGG GCTGACATTA 
ACTGGGGCTT GGGCACTGTT GATGCAACGT TATTTGCATG AATATCAATT GCCAGCCACC 
GCCTTCGCGC CATTTGCGGT TAATGCACAT GCCAATGGGG CTGGCAATCG CCATGCGCTG 
TATCGCTTTG CAATCAACGC TCAAAAATGG GCCAATGCCG GCCAAATTGC CGAGCCATTG 
AATATGCTCG ATTGCTCGAC GGTGGCCGAT GGTGCAGCAG CAGTGGTGTT GGTCAGCCAA 
CGCTATGCCC GCGAAATAGC GCAGCCAATC GCAATTGTGG GCAGCGCAAC CAGCAGCACC 
AATGTTGCCT TGGCGCAACG CCCCGATCTG TTGTGGCTTG AAGCGGCAGC AGCTAGCGGT 
AACAACGCGT TGCAACAAGC TAAACTCAAG CGCGATGCAA TTAACATCAT CGAATTAAGC 
GACCCGCACG GGATTGCCGC AGCCTTGAGT TTAGAGGCAC TTGGGTATGC CGAACGTGGT 
CATGCCACAC AACTGGCCGC CGAAGGTGTG ATTGCCAAGG ATGGCGCGTT GCCTTTGGCG 
ACTGCTGGGG GCTACAAAGC TCGTGGCGAT GTTGGCGGCG CAACCGGAGT CTATCAAGTG 
GTTGAGTTAG TGGCTCAACT GCGCGGCCAA GCCGGAGCCA ACCAAATTGC CAATGCCAAA 
ACAGCCCTAG CCCAGTGCTT GGGTGGCGTT GGCGCAACTG CCGTGACTCA TATTTTGCAA 
GTAGCGGAGG TCTAG

Protein sequence

MNQVFIAGTA CTAVREHYDR SLLDLALEAL HGAVGSLDPS LIQALYVGNA LGDTLSEQSQ 
LGAYIAGAAG LNCEAVRVEA AGASGALALR QGYLAIASGQ ADVVVVLGVE KATDKLDAAL 
QAALALGLDG ELERALGLTL TGAWALLMQR YLHEYQLPAT AFAPFAVNAH ANGAGNRHAL 
YRFAINAQKW ANAGQIAEPL NMLDCSTVAD GAAAVVLVSQ RYAREIAQPI AIVGSATSST 
NVALAQRPDL LWLEAAAASG NNALQQAKLK RDAINIIELS DPHGIAAALS LEALGYAERG 
HATQLAAEGV IAKDGALPLA TAGGYKARGD VGGATGVYQV VELVAQLRGQ AGANQIANAK 
TALAQCLGGV GATAVTHILQ VAEV