Gene Franean1_3017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3017
Symbol
ID	5671399
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3551036
End bp	3552238
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	71%
IMG OID	641241919
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001507339
Protein GI	158314831
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.712178
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTCGTCG TAGCGAAGGG TTCGATCCGC GACGTCGTGT TCGTCGACGG AGTGCGCACC 
CCGTTCGGCA AGGCAAAGGG CGTCTATGCC GAGACCCGGG CGGACGACCT GGTGATCCGG 
GTAATCCGCG AGCTGATCCG GCGCAACCCC GGGCTGCCGC CGGAGCGGAT CGACGAGGTC 
GCGGTCGCCG CGACCACCCA GATCGGCGAC CAGGGCCTGA CCATTGGCCG GGTCGCCGGG 
ATCCTGGCCG GGCTGCCCGA GTCGGTGCCC GGCTACGCCA TCGACCGGAT GTGCGCAGGT 
GCCGTGACCG CGGTGACCAC GACCGCGTCG GCGATCGCCG TCGGCGCCTA CGACGTGGCG 
ATCGCCGGGG GCGTCGAGCA CATGGGCCGC CATCCGATGG GCGAGGGCGC CGACCCGAAC 
CCCCGGTTCG TCTCCGAGCG GCTCGTCGAC CCGTCCGCGC TGGTCATGGG CATGACCGCC 
GAGAACGTGC ACGACCGCTA CCCCGGCATC ACCCGGGCCC GGGCGGACGC CTACGCCCTG 
GCGTCCCAGC AGAAGGTCGC CAAGGCCTAC GCCGACGGGA AGATCCAGCC CGACCTCGTG 
CCCGTCGCGG CCCGGCACAC CGACAGTGGG TGGGAACTGG TCACCGCCGA CGAACCGCCG 
CGGCCCGACA CGACACTCGA GGGCCTCGCC GGACTGCGCA CCCCGTTCCG CCCGCACGGG 
CGGGTCACCG CCGGCAACGC TGCGGGCATC AACGACGGTG CGACCGGCTG CGTGCTGGCC 
GCCGCCGAGG TAGCCGCCGA ACTCGGCCTG GAGCGGAGGA TGACCCTCGT CGGGTTCGGG 
TTCGCCGGGG TGGCGCCAGA AGTGATGGGC GTCGGGCCAA TCCCGTCCAC GGAGAAGGCG 
CTGGCCCGTA CCGGCCTGAG CATCGACGAC ATCGGACTGT TCGAGCTGAA CGAGGCCTTC 
GCGGTGCAGG TGCTGGCCTT CCTGGACCAC TTCGGCATCG CCGACGACGA CCCGCGGGTG 
AACCAGTACG GTGGCGCGAT CGCCCTGGGA CACCCGCTCG CCTCCAGCGG GGTCCGGCTG 
ATGACACAAC TGGCCCGGCA GTTCGAGGAA CACCCCGATG TCCGCTACGG CCTGACCGCG 
ATGTGCGTTG GCTTCGGCAT GGGCGCCACC ACCATCTGGG AGAACCCGCA CCACATGGCC 
TGA

Protein sequence

MFVVAKGSIR DVVFVDGVRT PFGKAKGVYA ETRADDLVIR VIRELIRRNP GLPPERIDEV 
AVAATTQIGD QGLTIGRVAG ILAGLPESVP GYAIDRMCAG AVTAVTTTAS AIAVGAYDVA 
IAGGVEHMGR HPMGEGADPN PRFVSERLVD PSALVMGMTA ENVHDRYPGI TRARADAYAL 
ASQQKVAKAY ADGKIQPDLV PVAARHTDSG WELVTADEPP RPDTTLEGLA GLRTPFRPHG 
RVTAGNAAGI NDGATGCVLA AAEVAAELGL ERRMTLVGFG FAGVAPEVMG VGPIPSTEKA 
LARTGLSIDD IGLFELNEAF AVQVLAFLDH FGIADDDPRV NQYGGAIALG HPLASSGVRL 
MTQLARQFEE HPDVRYGLTA MCVGFGMGAT TIWENPHHMA