Gene Franean1_4311 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4311
Symbol
ID	5672666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5149811
End bp	5151244
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	70%
IMG OID	641243184
Product	long-chain-fatty-acid--CoA ligase
Protein accession	YP_001508601
Protein GI	158316093
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.569405
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATGGG AAACCATCCC GGAGATGGTG CTGAGCGCGG CCGACCGCTT CGACGACGCC 
GAGGCGGTCG TCGACGGTGC GCTGCGCCTC ACCTACACCG AGCTGGTCGA CCGCATCCGT 
GCCGCCGCGG GCTCGTTCGC GGCGGCGGGG GTGGGCAAGG GTGACCGGGT CGCGATCTGG 
GCGCCGAACT CCGCCGAGTG GATCATCGCG GCCTTCGGGC TGCTGACCGC CGGCGGGGTT 
CTGGTGCCGG TGAACACCCG GTACAAGGCG GAGGAGGCCG ACGACATCCT CCGCCGGAGC 
GGGGCCAAGA TGGTCCTGGT CCAGGAGGGT TTCCTCGGGC AGGTCTACGC CGGCACCACC 
TGTGTCCCCG CCGTTGACAT CAAGTCGGGC TTCCTGTCGA GCGGCGCGCC GCTCGACGGG 
CCGGTGGGCC AGGACGGCGA CGAGACCGCC GACATCCTGT TCACCTCGGG CACGACCGGG 
CGTCCCAAGG GCGTCATGAT GAACCACCGG CAGACGCTGC GGCTGTACGA GGAGTGGTGC 
GAGCTCGCCG ACCTGCGCGA GGGCGACCGC TACCTCTGCG TGAACCCGTT CTTCCACAAC 
TTCGGGTACA AGGCGGGCCT CGTCGCGGCG CTCATCCGCG GCGCGACGAT CGTGCCGATG 
GCGGTCTTCG AGATCGACAA GCTGATCGAG CTGGTCGAGC GCGAGAAGAT CACGATGCTG 
CCCGGCCCGC CGACGCTCTA CCACTCGCTG CTGGCGGTGC CGGACAAGAC CGCGCTGGCC 
TCGCTGCGGT GCGCCGTCAC CGGGTCGGCC GACATCCCTG TCGAGCTGAT CCGGCGGATG 
CGTGACGAGC TGCCGTTCCG GTCGATCATG ACCGGCTACG GCCTCACCGA GGCGGGGACG 
GCGACCGCGT CGAGGCCGGG CGACTCGTTC GTGGACATCG CGACCACGGT CGGCACCGCC 
TGCGACGGTG TCGAGGTGGC CGTCGCCGAC GACGGCGAGG TGCTCGTCCG CGGGTACACG 
GTGATGCAGG GCTACCTCGA CGACCCGGTC GCCACCGCCG AGGCGATCGA CCCCGACGGC 
TGGCTGCACA CCGGTGACCT CGGCACGCTC GACGAGCGGG GGCACCTGCG GATCGTCGGC 
CGCAAGAAGG ACATGTTCAT CGTCGGGGGC TTCAACGCCT ACCCGGCCGA GATCGAGGGG 
TTCCTGCTCG AGCACCCCGC GGTCGCGCAG GCGGCCGTCA TCGGCGTCCC GGACGAGCGG 
ATGGGCGAGG TCGGCAAGGC CTTCGTCGTC CGGCGCGCCC CGGTCACCGC GGATGAGCTG 
ATCACCTGGA GCAAGGGCAG GATGGCGGGG TTCAAGGTGC CGAGGACGGT GGAGTTTCTC 
GAGAGCCTCC CGCTGAACGC CTCGGGAAAG GTGATGAAGG ACAACCTGCG GTGA

Protein sequence

MKWETIPEMV LSAADRFDDA EAVVDGALRL TYTELVDRIR AAAGSFAAAG VGKGDRVAIW 
APNSAEWIIA AFGLLTAGGV LVPVNTRYKA EEADDILRRS GAKMVLVQEG FLGQVYAGTT 
CVPAVDIKSG FLSSGAPLDG PVGQDGDETA DILFTSGTTG RPKGVMMNHR QTLRLYEEWC 
ELADLREGDR YLCVNPFFHN FGYKAGLVAA LIRGATIVPM AVFEIDKLIE LVEREKITML 
PGPPTLYHSL LAVPDKTALA SLRCAVTGSA DIPVELIRRM RDELPFRSIM TGYGLTEAGT 
ATASRPGDSF VDIATTVGTA CDGVEVAVAD DGEVLVRGYT VMQGYLDDPV ATAEAIDPDG 
WLHTGDLGTL DERGHLRIVG RKKDMFIVGG FNAYPAEIEG FLLEHPAVAQ AAVIGVPDER 
MGEVGKAFVV RRAPVTADEL ITWSKGRMAG FKVPRTVEFL ESLPLNASGK VMKDNLR