Gene Franean1_6477 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6477
Symbol
ID	5674792
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	7874674
End bp	7875867
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	74%
IMG OID	641245325
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001510720
Protein GI	158318212
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0438071
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGACG CCGTCGTCGT CGAAGCGGTG CGGTCCCCGA TCGGGCGGGG ACGCGCCAGC 
GGCAGCCTCG CCCCCGTCCA CCCCATCGAC CTGCTGGCGC ACAGCATCTC CGCGGCCGTC 
GAGCGGTCCG GCGTCGATCC GGCGCTGATC GACGACGTCA TCGCCGGCTG CGTGACCCAG 
AGCGGGGAGC AGGCCGCGAA CATCGCCCGC TGGGCGACCC TGGCCGCCGG ACTGCCCGAG 
TCGGTGCCCG GGACCACCGT CGACCGCCAG TGCGGCTCGT CCCAGCAGGC CGTCCACTTC 
GCCGCGCAGG GCGTCATCGC CGGCGCCTAC GACATGGTCC TGGCCTGTGG TGTCGAGTCG 
ATGGGGCGGG TCCCGATGGG CTCCGCGACG CTCCCCGGAG ACAGCCACGG CACCCGGATC 
AACGCCCGCT ACCCGGACGG GCTGATCTCG CAGGGCATCA GCGCCGAGCT GATCGGCGCG 
CGGCGGGGCC TCGGCCGCGC CGAGATGGAC GAGTTCGCCC TCGCCAGCCA CCAGCGCGCC 
GCCACCGCGG CCCGGGATGG CCTGTTCACC CCGGAGATCG CGCCGGTGAA GGTCACCGGG 
CCGGACGGGT CGGTCGTCGA GTTCTCCGCC GACGAGGGCA TCCGCCCGGC GTCGAGCACG 
CAGGCCCTCG CGGGTCTGCG CCCGGCCTTC TACGACGAGG CCACCGCCGC GCGTTTCCCG 
GAGATCGGCT GGAACGTGAC GGCCGGCAAC GCCTCGCAGA TCAGCGACGG CTCCGCCGCG 
CTGCTGATCA CCACCTCGGA GCGGGCCCGC GAACTGGGGC TGCGCCCGCT CGCCCGGCTG 
CACAGCTTCG CCGTCGTCGG CGACGACCCG TTCCTGATGC TGCGCGGCGT CATCCCCGCC 
ACCCGCCGGG TGCTGGAGCG CTCGGGCCTG AGCCTGGACG ACATCGACCT GTTCGAGGTG 
AACGAGGCCT TCGCCGCGGT CGTGCTGGAC TGGCGCGCCG AGATCGGCGC ATCGGCGGAG 
AAGGTCAACG CCCGGGGCGG CGCGATCGCG CTCGGCCACC CGCTCGGCGC CAGCGGCGCC 
CGGATCATGA CGACCCTCGT GCACGCGCTG CACCAGACCG GCGGCCGGTT CGGGCTGCAG 
ACGATGTGCG AGGCGGGCGG CCTCGCGAAC GCGACCATCA TCGAGCGCCT CTGA

Protein sequence

MRDAVVVEAV RSPIGRGRAS GSLAPVHPID LLAHSISAAV ERSGVDPALI DDVIAGCVTQ 
SGEQAANIAR WATLAAGLPE SVPGTTVDRQ CGSSQQAVHF AAQGVIAGAY DMVLACGVES 
MGRVPMGSAT LPGDSHGTRI NARYPDGLIS QGISAELIGA RRGLGRAEMD EFALASHQRA 
ATAARDGLFT PEIAPVKVTG PDGSVVEFSA DEGIRPASST QALAGLRPAF YDEATAARFP 
EIGWNVTAGN ASQISDGSAA LLITTSERAR ELGLRPLARL HSFAVVGDDP FLMLRGVIPA 
TRRVLERSGL SLDDIDLFEV NEAFAAVVLD WRAEIGASAE KVNARGGAIA LGHPLGASGA 
RIMTTLVHAL HQTGGRFGLQ TMCEAGGLAN ATIIERL