Gene Franean1_1044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1044
Symbol
ID	5669458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1223889
End bp	1225073
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	72%
IMG OID	641239973
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001505406
Protein GI	158312898
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0241668
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGGTT CTGTCATCGT GGCCGGTGCG CGCACCCCGA TCGGCAAGCT CTCCGGCGCC 
CTCAAGGACT TCACCGCGGT CGACCTGGGC GGTATCGCCA TCCGCGCCGC GCTCGAGCGG 
GCCGGGCTGG CCGGCGACGC CGTCGACTAC GTCATCCTGG GCCAGGTCAT CCAGGCCGGC 
GCCGGCCAGG CCGCCGCCCG CCAGGCCGCC GTGAAGGGCG GCATCCCGAT GACGGTGCCG 
TCCACCAGCA TCAACAAGGT GTGCCTGTCG GGCCTGAACG CCATCTCGCT GGCGGACCTC 
TACATCTCCA GCGGTCAGTA CGACGTCATC GTGGCCGGTG GCATGGAGTC GATGACCCGC 
GCGCCGCACC TGCTGCCCGC GCTGCGCGGC GGCGTCAAGT ACGGCGACAC CACCCTGACG 
GACTCGATCG CGGTGGATGC CCTCACCTGC GGGTTCGACC AGGTGTCGAT GGGTCTCGCG 
ACAGACCGGT ACAACTCCCG CTACGGCATC ACCCGCGAGG AGCAGGACGA GTTCAGCGCC 
CGGTCGCATC AGCGGGCCGC GGCCGCGGCG AAGAACGGCC TGTTCGAGAA CGAGATCGTC 
CCGGTCGAGG TGCCCCAGCG CCGCGGCGAC CCGATCGTCG TCAGCGCGGA CGAGGGCGTC 
CGGGCCGAGA CGACCGCGGA GAGCCTGGCG AAGCTGCGCC CGGCGTTCGA CAAGGCCGGC 
TCGATCACCG CCGGCTCGGC CTCCCAGATC TCGGACGGCG CGGCCGCGGT CGTCGTGACG 
AGCCGGGCGA AGGCCGAGGA GCTGGGCCTG CCGATCATCG CCGAGGTCGG CCACCACGGT 
TACGTGTCCG GCCCGGACCC GTCCCTGCAC TCCCAGCCGT CGAACGCGAT CCTCGCGGCC 
CTGGCGAAGG AGAAGCTGAC CCCGGCCGAC CTCGACCTCG TCGAGATCAA CGAGGCGTTC 
GCGGCCGTCG GCATCCAGTC GATGCGCGAG CTGGGGATCG GCCCGGACAT CACCAACGTC 
AACGGCGGCG CGATCGCGGT CGGCCACCCG GTTGGGATGT CTGGCACCCG GGTCGCGCTC 
ACCCTCCTGC TCGAGCTGCA GCGCCGCGGC GGCGGCATCG GCGCGGCGGC GCTGTGCGGC 
GGCGGCGGCC AGGGCGACGC CCTGGTGCTG CGCGTTCCGG CGTGA

Protein sequence

MPGSVIVAGA RTPIGKLSGA LKDFTAVDLG GIAIRAALER AGLAGDAVDY VILGQVIQAG 
AGQAAARQAA VKGGIPMTVP STSINKVCLS GLNAISLADL YISSGQYDVI VAGGMESMTR 
APHLLPALRG GVKYGDTTLT DSIAVDALTC GFDQVSMGLA TDRYNSRYGI TREEQDEFSA 
RSHQRAAAAA KNGLFENEIV PVEVPQRRGD PIVVSADEGV RAETTAESLA KLRPAFDKAG 
SITAGSASQI SDGAAAVVVT SRAKAEELGL PIIAEVGHHG YVSGPDPSLH SQPSNAILAA 
LAKEKLTPAD LDLVEINEAF AAVGIQSMRE LGIGPDITNV NGGAIAVGHP VGMSGTRVAL 
TLLLELQRRG GGIGAAALCG GGGQGDALVL RVPA