Gene Haur_4388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4388
Symbol
ID	5736238
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5604638
End bp	5605792
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	53%
IMG OID	641281550
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001547148
Protein GI	159900901
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000185957
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGAAG CAGTGTTAAT TGATGCCGTT CGCACGCCGA TTGGTCGCCA ACAAGGCAGC 
CTACGCGATG TGCGCCCCGA TGTTTTATAT GCCCATGTGC TCAACACTTT AATCGAACGC 
ACTGGGATTG ATCCAAACCT GATTGAAGAT GTGGTTACTG GTTGCGTAAC CAATACTGGT 
GAGCAAGGCG CAAATATTGG TCGTTTGGGC GTGATGCTCT CCAATTTGCC AATTACGGTT 
CCGGCGGTAA CCCTCAACCG CATGTGTGGC TCGGCTCAGC AGGCGATTCA TTTCGCGGCG 
CAGGCAATTG CCGCAGGCGA CGTGAGCTAT GCAATCGCTG GCGGGGTTGA ATCGATGAGC 
CGCGTGCCGA TGTTTAGCGA TGTGACAGGC AATTTTGCCA CCTTCAATCC TGCGATCAAC 
GAAAAATATC AACTGGTGCA CCAAGGCGAA TCAGCCGAAC TCATTGCCGA GAAATATCAA 
TTATCGCGCA CCGAGCTTGA TGATTGGAGC TTTGAGAGCC ATCAACGCGC CGCTGCCGCG 
ACCAAGGCTG GTTGGTTTAG CAGCCAACTC GCGCCAATCG TTGGCAGCGA TAAAACTGGT 
AATCCCCACG AATTAATCTA CGATGAAGGC ATTCGCTTCG AGGCTGATCG CGCCAAGATG 
GGCACGCTCA AAACGGTGTT CCGTGCCGAT GGCGTGGTGA CTGCCGCCAA CGCCAGCCAA 
ATTTCCGATG GTGCAGCGGT TGTATTAATT GGTGAGCGCG AGCAAGCTCT CGCCGATGGT 
TTCAAGCCCC GTGCTAAATT CCGTGCTCGC GTGGTTGCCG CTGGTGATCC ACGCATGCAG 
TTGCTCGAAG TAATTCCTGC GACGCATAAA GCCTTAGCCA AGGCTGGCTT GAGCATCAAC 
GATATTGATC TGGTCGAAAT CAACGAGGCT TTTGCTTCAG TGGTGTTGGC ATGGTTGCGT 
GAATTCAAGC TTGATCCTAG CCGCGTAAAT CCCAACGGCG GCGCGATTGC TCATGGTCAC 
CCATTGGGCG CAACTGGCGC AGTCTTGATG AGCAAAATGA TCAACGAACT GGAACGCCGC 
GATGCTCAAT TTGGCTTGCA AGTGATGTGC ATCGGTCACG GTCAAGCGAC CGCCACCATT 
ATTGAGCGGG TATAA

Protein sequence

MAEAVLIDAV RTPIGRQQGS LRDVRPDVLY AHVLNTLIER TGIDPNLIED VVTGCVTNTG 
EQGANIGRLG VMLSNLPITV PAVTLNRMCG SAQQAIHFAA QAIAAGDVSY AIAGGVESMS 
RVPMFSDVTG NFATFNPAIN EKYQLVHQGE SAELIAEKYQ LSRTELDDWS FESHQRAAAA 
TKAGWFSSQL APIVGSDKTG NPHELIYDEG IRFEADRAKM GTLKTVFRAD GVVTAANASQ 
ISDGAAVVLI GEREQALADG FKPRAKFRAR VVAAGDPRMQ LLEVIPATHK ALAKAGLSIN 
DIDLVEINEA FASVVLAWLR EFKLDPSRVN PNGGAIAHGH PLGATGAVLM SKMINELERR 
DAQFGLQVMC IGHGQATATI IERV