Gene Franean1_4577 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4577
Symbol
ID	5672924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5459955
End bp	5461121
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	75%
IMG OID	641243440
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001508856
Protein GI	158316348
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.4334
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.466675
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCAGG CCGTGATCGT CAGTGCGGTG CGCACGCCCA TCGCGACGTC GTTCAAGGGG 
ACGCTGCGGG ACACCTCGGC CGAGGAGCTG GCCACGGCGG TCGTCCGGGC CGCGGTGGAC 
CGCTCGGGGC TGGCGCCCGA GGACGTCGAC GACGTCATCC TCGCCGAGGA GCTGGCCGGC 
GGCGGCGACA TCGCCAGGTA CGCCGCCTTC GCGGCCGGGC TGACGGCGGC GCCGGGCCAG 
GCCGTCAACC GCCACTGCGC GGCGAGCCTC GCGGCGGTGG GCAACGCGGC GGCGACGATC 
CGGGCCGGGA TGGACCGCGC GGTCGTCGCC GGCGGCACCC ACTCCTCGTC GATGAACCCC 
AGGCTGTCGT GGCGGGTGCC CGGGTCGGAC GAGCCGCGCG CCGGGTTCAA CCCCACGTTC 
CCCTACTACG AGGGCGCCAC CGACGACGTG ACCCTCGCCG TCGGCTGGAA CACCGCGCAG 
GAGGTGGGCA TCACCCGGGC GGAGATGGAC GCCTGGGCCA AGCGCTCCCA CGACCGGGCG 
ATCGCCGCGA TCGACGCCGG AGTCTTCGAC GACGAGATCG TCCCGATCGA CGTCGTCGTG 
GCGGGGGAGA AGGTCCGCTT CGCCGTCGAC GAGCACCCGC GCCGGACGTC CACGCTGGAG 
AAGCTGGCCA CGCTGAAGCC GCTGCACCCC GAGATCGAGG GCTTCGGCAT CACCGCGGGG 
AACGCGAGCG GCGTGAACGA CGCCGCCGCG GCCCTGATGC TGGTCACCGA CGACCTCGCC 
CGGGATCGGG GCCTCACCCC GCTGGCCCGG GTGCGGGCGT GGGCGGCACT CGGCGTGGCC 
CCGCACCGCA CCGGGATGGC CGGGGTGGAG GTCATCCCGC GGGTGCTGGA GCGGGCCGGG 
ATCGGGGTGG CCGACGTCGA CGCCTGGGAG ATCAACGAGG CCTTCGCGTC GGTCCCGATC 
GCCGCCTGCC GCCTCCTGGG AATCCCGGAC GACCTGGTCA ACCAGTACGG CAGTGGCTGC 
AGTCTCGGGC ATCCGGTCGC GGCCTCCGGA GCGCGGATGC TGACCACCCT GACCCACCAC 
CTGCGCCGGC GCGGCGGCGG GATCGCCGTG GCGGCGATGT GCGCCGCGGG CGGCCAGGGC 
GGCGCAGTGG TCATCGAGGC GCCGTGA

Protein sequence

MAQAVIVSAV RTPIATSFKG TLRDTSAEEL ATAVVRAAVD RSGLAPEDVD DVILAEELAG 
GGDIARYAAF AAGLTAAPGQ AVNRHCAASL AAVGNAAATI RAGMDRAVVA GGTHSSSMNP 
RLSWRVPGSD EPRAGFNPTF PYYEGATDDV TLAVGWNTAQ EVGITRAEMD AWAKRSHDRA 
IAAIDAGVFD DEIVPIDVVV AGEKVRFAVD EHPRRTSTLE KLATLKPLHP EIEGFGITAG 
NASGVNDAAA ALMLVTDDLA RDRGLTPLAR VRAWAALGVA PHRTGMAGVE VIPRVLERAG 
IGVADVDAWE INEAFASVPI AACRLLGIPD DLVNQYGSGC SLGHPVAASG ARMLTTLTHH 
LRRRGGGIAV AAMCAAGGQG GAVVIEAP