Gene Franean1_3389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3389
Symbol
ID	5671760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4014956
End bp	4016098
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	69%
IMG OID	641242277
Product	Propanoyl-CoA C-acyltransferase
Protein accession	YP_001507697
Protein GI	158315189
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0952002
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGACG TCGCCATCAT CGGCGTGGGC CTGCATCCCT TCGGTCGCTT CGAGAAGTCG 
GCCATGGAGC TCGGCGCGGA CGCGATCCAG CTGGCGCTGA AGGATGCCGG GATCGAGTGG 
AAGGACATCC AGTTCGGTGT CGGTGGCAGC CTGGAGGTCG CCAACCCGGA CGCGGTGACG 
AGGCTCGTCG GGCTGACCGG CATCCCGTTC ACCGACGTGT TCAACGCCTG CGCGACCGCG 
GCCAGCGCCA TCCAGCTGTG CGCCGACACG ATCCGGCTCG GCAAGTACGA CATCGGCATC 
GCCGTGGGCA TGGACAAGCA CCCGCGCGGT GCTTTCACCG CCGACCCGTC GATGCTCGGC 
CTGCCGTCGT GGTATGCCGA GAACGGCCAG TTCGTCACCA CGCAGTTCTT CGGGATCAAG 
GCCAACCGCT ACCTCCACGA GCACGGCATC TCGCAGCGGA CGCTGGCGAA GGTCGCCGCC 
AAGAACTACC GCAACGGCGT GCTCAACCCG AACGCCTTCC GGCGTAAGCC GTTGAGCGAG 
GAGGAGATCC TCGGCTCGCC CATGCTCAAC TATCCGTTGA CGCACTACAT GTTCTGCTCG 
CCGGACGAGG GCGCCGCCGC CGCCATCATG TGCCGCGCCG ACATCGCGCA CCGGTTCACC 
TCGCAGCCGA TCTACCTGCG CGCCGCGGAG ATCCGCACCC GCCGCTTCGG CGCCTACGAG 
GTGCACAGCA CCTTCGCACC GGTCGACGAG GACGTCGCGC CGACCGTCTA CGCCGCCCGC 
GCCGCCTTCG AGGCGGCCGG CGTCGGCCCG GGCGACGTCG ACGTGATCCA GCTTCAGGAC 
ACGGATGCCG GCGCGGAGAT CATTCACATG GCCGAGTGCG GCTTCTGCGC CGACGGTGAG 
CAGGAGAAGC TGCTCGCCGA GGGCGCGACC GAGATCAACG GCCCGTTGCC GGTCAACACC 
GACGGCGGCC TCATCGCCAA CGGCGAGCCG ATCGGCGCAT CCGGGCTCCG CCAGGTGCAC 
GAGCTGGTCC GCCAGCTGCG TGGTCAGGCG GGTGACCGTC AGGTCGCCGG CAACCCGCGC 
GTCGGATTCG CCCAGGTCTA CGGCGCCCCC GGCACGGCCG CGGCCACCGT CCTCACCGTC 
TGA

Protein sequence

MNDVAIIGVG LHPFGRFEKS AMELGADAIQ LALKDAGIEW KDIQFGVGGS LEVANPDAVT 
RLVGLTGIPF TDVFNACATA ASAIQLCADT IRLGKYDIGI AVGMDKHPRG AFTADPSMLG 
LPSWYAENGQ FVTTQFFGIK ANRYLHEHGI SQRTLAKVAA KNYRNGVLNP NAFRRKPLSE 
EEILGSPMLN YPLTHYMFCS PDEGAAAAIM CRADIAHRFT SQPIYLRAAE IRTRRFGAYE 
VHSTFAPVDE DVAPTVYAAR AAFEAAGVGP GDVDVIQLQD TDAGAEIIHM AECGFCADGE 
QEKLLAEGAT EINGPLPVNT DGGLIANGEP IGASGLRQVH ELVRQLRGQA GDRQVAGNPR 
VGFAQVYGAP GTAAATVLTV