Gene Francci3_2244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2244
Symbol
ID	3905012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2617787
End bp	2618953
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	69%
IMG OID	637879575
Product	acetyl-CoA acetyltransferase
Protein accession	YP_481341
Protein GI	86740941
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.106872
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0160959
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACGACG TGGAGATCGT GGGCTGGGGT CATACCCCGT TTGGCCGTCT GCCCGAGGAG 
ACTCTGGAGT CGCTGATCGT TGCCGCCGCG CGGGAGGCGA TCGCGTCGGC GGGTCTGCGC 
CCGCGGGAGA TCGACGAGAT TGTTCTCGGT ACCTATAACG CGGGGTTGCA GCCGTTGGCG 
TTTCCTTCCT CGCTGGTGCT GGAGGCCGAT GACGATCTGC TGTTCACCCC GGCGACCCGG 
GTGGAGAACG CGTGTGCGAG CGGGTCGGCG GCGTTGCTGT GCGGGGTGCG GGCGATTCGG 
TCCGGGCAGG CGCGCCGGGT GCTGGTGGTC GGGGCGGAGA AGATGACCCA CGCGTCGGCC 
GAGGTTGTCG GTGGGGCTTT GCTGGGTGCC GACTATGAGC ATGCCGGCGA GTGCGCGCCT 
GCCGGGTTCG CGCGGTTGTT CGCCGATGTC GCCGAGGCCT ACTTCACCAA GTATGGTGAT 
CACAGTGACG CGTTGGCGCG GATCGCGGCG AAGAATCATC GTAACGGGGT GGTGAATCCG 
TACGCCCATC TGCGTTCCGA TCTCGGCTTC GAGTTCTGTA GCACGGTCGG TCCGCGTAAT 
CCGGTGGTCG CGGGTCCGCT GCGGCGTACG GACTGCTGTC CGGTCTCGGA TGGTGCCGCC 
GCGGTGGTGC TGGCCGCGCC GGGTGGTGCG CCGCGTGCCC CGGCGGTGCG GATCCGTGCT 
CTGGCGCAGG CCAACGATTT CCTGCCGGCC GCGCGGCGTC ATCCGCTGGC GTTCGCCGCC 
GCGCATGGGG CCTGGCAGGC GGCGTTGGGG CAGGCCCGGG TGCGGCTGTC CGACCTGCAC 
CTGCTGGAGC TGCACGACTG TTTCACCATC GCGGAGTTGC TGGAGTACGA GGTCGTCGGG 
TTGTGCCCGC CGGGCGGCGG GGGGCAGGTC ATCCTCGGTG GGGTCGTGGA CCGGGACGGC 
ACGCTGCCGG TCAACCCCTC CGGGGGGTTG AAGGCCAAGG GTCATCCGGT TGGTGCCACC 
GGGGTGTCCC AGCATGTGAT GGCGGTCCTG CAGCTCACCG GCACCGCCGG GGCGATGCAG 
ATCCCCGGGG CCACCGTCGC CGGGGTGTTC AACATGGGTG GCCTGGCGGT CGCCAACTAT 
GCGAGTGTCC TGGAGCGTGT GCGATGA

Protein sequence

MDDVEIVGWG HTPFGRLPEE TLESLIVAAA REAIASAGLR PREIDEIVLG TYNAGLQPLA 
FPSSLVLEAD DDLLFTPATR VENACASGSA ALLCGVRAIR SGQARRVLVV GAEKMTHASA 
EVVGGALLGA DYEHAGECAP AGFARLFADV AEAYFTKYGD HSDALARIAA KNHRNGVVNP 
YAHLRSDLGF EFCSTVGPRN PVVAGPLRRT DCCPVSDGAA AVVLAAPGGA PRAPAVRIRA 
LAQANDFLPA ARRHPLAFAA AHGAWQAALG QARVRLSDLH LLELHDCFTI AELLEYEVVG 
LCPPGGGGQV ILGGVVDRDG TLPVNPSGGL KAKGHPVGAT GVSQHVMAVL QLTGTAGAMQ 
IPGATVAGVF NMGGLAVANY ASVLERVR