Gene Franean1_3657 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3657
Symbol
ID	5672023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4333845
End bp	4334990
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	72%
IMG OID	641242540
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001507960
Protein GI	158315452
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.838334
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGACG CGGTGATCGT GGAGGCCCTC CGCACGCCGA CCGGCAAGCG CAATGGTTCC 
CTGTCGGGTG TGCATCCGAC GGATCTTTCG GCGCACGTGC TGGCGAGCCT CGCCGAGCGG 
GCCGGCGTCG ATCCGGCTCT GGTGGACGAC GTGGTGTGGG GCTGTGTCGG CCAGGTGGGC 
GAGCAGACCT TCGACATCGC CCGCAACGCC GCGCTCGGTG CCGGCTGGCC GGAGACCGTC 
ACCGGCGTGA CCGTCGACCG CCAGTGCGGC TCGGGCCAGC AGGCGGTGCA CTTCGCCGCC 
GCCGGGCTGA TCGCGGGGCA GTACGACGTG GTCGTCGCCG GCGGCGTCGA GTCGATGTCC 
CGGGTGCCGA TGGGCTCCTC CCTGATGGAC AAGGTCCCCT TCGGCGAGCG GTACCTGGCC 
CGCTACAACG GCGCCTTCCC GGACCAGGGC ATCGGCGCCG AGATGATCGC GGAGCGCTGG 
GGCCTGTCGC GGACCCAGCT CGACGAGTTC GCGCTGCTCT CCCACGAGCG GGCGGCGGCG 
GCGCAGGACG ACGGCCGCTT CGACGAGCAG ATCATCCCGG TCACCCTGAC CGACGGCACC 
GTGGCCAGCA AGGACGAGGG CATCCGCCGC GGCGGCACGG TCGAGGGCCT CGCCGGGCTC 
CGGACGGCTT TCAAGCCGGA CGGCGTGATC ACAGCGGCGA ACTCGTCCCA GATCTCCGAC 
GGCTCGTCGG CACTGCTGAT GACGACCAGT GAGAAGGCCG CCGAGCTGGG CCTGTGCCCG 
ATCGCCCGGG TGCACACCGC CGTCCTCGCT GGCACCGACC CGGTGATCAT GCTGACCGCG 
CCGATCCCCG CCACCCAGAA GGTGCTGGCG AAGTCCGGCC TGAAGCTCGA CGACATCGGT 
GCCTTCGAGG TCAACGAGGC GTTCGCCTCC GTGCCCCTGG CCTGGCTGGC CGACATCGGC 
GCCGACCCGA AGGCCCTGAA CCCGAACGGC GGCGCGATCG CCCTCGGCCA CCCGCTCGGC 
GGCTCCGGCA CCCGGCTCAT GACCACCCTG ATCTACCACA TGCGCGACAA CGGGATCCGC 
TACGGCCTGC AGACCATGTG CGAGGGCGGC GGCCAGGCGA ACGCCACCAT CCTCGAGCTG 
CTCTGA

Protein sequence

MRDAVIVEAL RTPTGKRNGS LSGVHPTDLS AHVLASLAER AGVDPALVDD VVWGCVGQVG 
EQTFDIARNA ALGAGWPETV TGVTVDRQCG SGQQAVHFAA AGLIAGQYDV VVAGGVESMS 
RVPMGSSLMD KVPFGERYLA RYNGAFPDQG IGAEMIAERW GLSRTQLDEF ALLSHERAAA 
AQDDGRFDEQ IIPVTLTDGT VASKDEGIRR GGTVEGLAGL RTAFKPDGVI TAANSSQISD 
GSSALLMTTS EKAAELGLCP IARVHTAVLA GTDPVIMLTA PIPATQKVLA KSGLKLDDIG 
AFEVNEAFAS VPLAWLADIG ADPKALNPNG GAIALGHPLG GSGTRLMTTL IYHMRDNGIR 
YGLQTMCEGG GQANATILEL L