Gene Franean1_2943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2943
Symbol
ID	5671329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3462238
End bp	3463449
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	68%
IMG OID	641241849
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001507269
Protein GI	158314761
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGCTG AAGCCTTCGT CTACGATGCC GTTCGCACGC CCCGTGGGCG TGGCCGGAAG 
GGATCACTGC ACGGGACCAA GCCGATCGAC CTGGTGGTCA GCCTCGTGGA CGCCCTACGC 
AAGCGCAACC CCACCCTTGA CCCCGAGCGG ATCGACGACC TCGTCCTGGG GGTCGTCACC 
CCCATCGGCG ACCAGGGATC GGACATCGCA CGTACCGCCG TGCTGGCCTC GGGCCTGCCC 
GACACGGTCG GAGGCGTACA GCTGAACCGG TTCTGTTCCT CGGGTCTGGA GGCAGTCAAC 
ACCGCCGCGC AGAAGGTGCG CTCGGGATGG GAATGCCTGG TGGTCGCCGG TGGAGTCGAG 
TCCATGTCCC GGGTCCCGAT GGCATCGGAC GGCGGTGCGT GGGCCCTGGA CCCGTGGACG 
AATCTCACGA CGTCGTTCGT GCCGCAGGGC GTCAGCGCCG ACCTCATCGC GACGATCGAG 
GGGTTTGACC GGGAGGCGGT CGACTCCTAT GCCGTCCGTT CTCAGGGGCT CGCGGCCAAG 
GCGTGGGCCG GGGGCTACTT CGAGCGATCT GTGGTCCCGG TCGTGGATCG CAACGGGCTG 
ACCGTCCTCG ACCGCGACGA GCACATGCGG CCCGAGACGA CCCTCGAGAG CCTCGCCGCG 
CTCAACCCGT CCTTCGCAGC GGTAGGCGAG CAGGGCGGCT TCGACGCGGT GGCGCTGCAG 
AAGTACCACT GGGTCGAGCG CATCGAACAC GTCCACCACG CCGGCAACTC CTCCGGCGTA 
GTCGACGGCG CCGCCCTGGT GGTCGTGGGG AACGAGGAGA TCGGACGCGA CCTGGGACTG 
ACACCGCGAG CTCGCATCGT GGCCACGGCG ACCAGCGGCG CGGACTCGAC GATCATGCTG 
ACCGGCCCGA CACCCGCGAC CCTCAAGGTG CTGACAAAGG CGGGGCTGAC ACCCGACGAC 
ATCGACCTGT TCGAGATCAA CGAGGCGTTC GCGTCGGTCG TCCTGAAGTA CCAGAAGGAC 
CTGCGAATTC CGGACGAGAA GCTCAACGTC AACGGCGGCG CGATCGCGAT GGGTCATCCG 
CTCGGGGCCA CCGGTGCCAT GATCCTCGGC ACCGTGGTCG ACGAGCTCGA ACGCCGTGAG 
GCCCGACGGG GTCTGGTCAC CTTGTGCGTC GGCGGTGGGA TGGGCGTGGC CACCGTGGTC 
GAGCGCGTCT GA

Protein sequence

MSAEAFVYDA VRTPRGRGRK GSLHGTKPID LVVSLVDALR KRNPTLDPER IDDLVLGVVT 
PIGDQGSDIA RTAVLASGLP DTVGGVQLNR FCSSGLEAVN TAAQKVRSGW ECLVVAGGVE 
SMSRVPMASD GGAWALDPWT NLTTSFVPQG VSADLIATIE GFDREAVDSY AVRSQGLAAK 
AWAGGYFERS VVPVVDRNGL TVLDRDEHMR PETTLESLAA LNPSFAAVGE QGGFDAVALQ 
KYHWVERIEH VHHAGNSSGV VDGAALVVVG NEEIGRDLGL TPRARIVATA TSGADSTIML 
TGPTPATLKV LTKAGLTPDD IDLFEINEAF ASVVLKYQKD LRIPDEKLNV NGGAIAMGHP 
LGATGAMILG TVVDELERRE ARRGLVTLCV GGGMGVATVV ERV