Gene Franean1_3929 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3929
Symbol
ID	5672290
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4698392
End bp	4699603
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	73%
IMG OID	641242808
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001508225
Protein GI	158315717
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.041846
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGAGG CGGTCATCTG CGAACCGGTG CGCACCGCGG TCGGGCGCTA CGGCGGTGCG 
CTCGCGGCGC TGAGCGCGCA GGCGCTCGGC GCGGCCGTGC TGCGCGGCCT GCTGGACCGG 
ACCGGCCTGC GGTCAGCGGA CATCGATGAC GTGATCTTCG GGTCGTGTTA TCCGACGATG 
GAGGCACCCG CGCTTGGCCG GGTGGTCGCC CTCGACGCCG GCCTCGACGT CACCGTCGCG 
GGCCTGCAGC TCGACCGCCG CTGCGGATCG GGCATGCAGG CGGTCACGAC GGCCGCGATG 
CAGGTCCAGA CCGGAGTGGC CGACGTCGTG ATCGCCGGGG GAGCGGAGAG CATGAGCAAC 
GCCCCCTTCT ACTCGACCCG GATGCGCCGG GGGTCGGGCG GCGGGGACGT CACGCTGCAC 
GACGCCCTGG CCCGCGGCCG GGTGACCGCG GGCGGCGCGA ACTTCCCCGT CCCGGGCGGG 
ATGATCGAGA CGGCGGAGAA CCTGCGGAGG GAGTACGGGA TCTCGCGCTC CGAGCAGGAC 
GAGTTCGCGC TGCGGTCGCA TGTCCGGGCC GTGGACGCGC AGGCCGCCGG TCGGTTCGCG 
GACGAGATCG TGTCGGTGTC GGTGCCGGGT CGCGGCGGTT CGGTCGTCGT GGACGTCGAC 
GAGCATCCCC GCGCCGACGC CAGCCTCGAC ACGCTCGCCG CGCTGCGCCC GATCATGGGT 
AGGACCGACC CGGAGGCCAC GGTCACTGCG GGCAATTCCA GCGGGCAGAA CGACGCGGCG 
TCGGCGTGTG TCGTCACCCA TCCGGAGGCG GCGAGGCGAC TCGGCCTGCG TCCGCTCGGT 
CGGCTGGTGA GCTGGGCGGT CGCCGGTGTG GAACCCGCGA GGATGGGGAT CGGACCCGTT 
GCGGCCACGG CGAAGGCGCT GGAGCGGGCG AACCTCAAGC TCGCCGACAT CGACCTGATC 
GAGCTCAACG AGGCCTTCGC GGCGCAGGTG CTCGCCTGCA CCCGGGAGTG GGGGCTCACG 
ACCGCGGACC TGGACCGGCT CAATGTCAAC GGTTCCGGGA TCTCGCTCGG TCATCCCGTC 
GCGGCGACCG GTGGCCGGAT CCTCGCGACC CTGCTTCACG AGATGGAGCG CCAGGACGCC 
CGGTACGGGC TGGAGACCCT GTGCATCGGC GGCGGCCAGG GGATCACCGC GATCTTCGAA 
CGGGTCGGCT GA

Protein sequence

MREAVICEPV RTAVGRYGGA LAALSAQALG AAVLRGLLDR TGLRSADIDD VIFGSCYPTM 
EAPALGRVVA LDAGLDVTVA GLQLDRRCGS GMQAVTTAAM QVQTGVADVV IAGGAESMSN 
APFYSTRMRR GSGGGDVTLH DALARGRVTA GGANFPVPGG MIETAENLRR EYGISRSEQD 
EFALRSHVRA VDAQAAGRFA DEIVSVSVPG RGGSVVVDVD EHPRADASLD TLAALRPIMG 
RTDPEATVTA GNSSGQNDAA SACVVTHPEA ARRLGLRPLG RLVSWAVAGV EPARMGIGPV 
AATAKALERA NLKLADIDLI ELNEAFAAQV LACTREWGLT TADLDRLNVN GSGISLGHPV 
AATGGRILAT LLHEMERQDA RYGLETLCIG GGQGITAIFE RVG