Gene Franean1_3422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3422
Symbol
ID	5671793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4051014
End bp	4052702
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	68%
IMG OID	641242310
Product	long-chain-fatty-acid--CoA ligase
Protein accession	YP_001507730
Protein GI	158315222
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAATC TACTCGAGGG GATTGATCGG GCTCGGCTTC AGGGCGGGCG GGTCGTCTTT 
CTGGACCCGG ACGCGGAGGA CGGTTTGAGC TGGTCTGATT TCTTCGTTCA GGCGGAGCGG 
GTCGCCGCGT GGTTGCAGGC TGCGCGTGGG ATTGGACCGA GTTCCCGTGT GGTGGTGTTG 
GCGACGCCGT CAAAGGCGAT GGTCACCGCA GTGGTGGCGG TCTGGATGGC CGGAGGCAGT 
GTGACTTGCG CCCCAACACC GGCGCGCACC GTCGACCTGC CGACCTACGT GGATCAGACC 
GGCAAGCGCA TCGCCGCGCT CGGTGACCCG CTCGTCCTGC TCGGTGCACC CTACGAGGAA 
CTTGGGGAGA CGCTAGCCAC CGACGGGGTC CGGGTCGACC GTCTCACCGA TGCGGTGGCT 
GCGGAATCGG CCGGCGCGTG GAAGAGACCC GAAATCACTC CTGACGACCC CGCGATCGTG 
CAGTTCACCA GCGGTACGAC CGCGGCTCCG AAAAGTGTCC TGATCAGTCA TGGAAACCTG 
GTGGCGAACA TCGCGGCGAT CCGAGAACGG ATCCGTCATG ACGAGGTCCA CGGCCGGCTG 
CTGAGCTGGC TGCCGCTGTC CCACGACATG GGCCTGATTG GCGCGCTCGC CGTGCAGCTG 
ACGTGCGGGC GTTGCGACGT GCTGTTCGGT ACGCCTGCGG ACTATCTGGC CTCCCCGTCG 
TCGTGGCTGG CCAATGCGGC TCGGTACCGG GCGACGATCC TACTGGGCCC GGCGTCCGCC 
TACGCAATGG CGGGACGGTT GCTGGCGGTC GGCCCGCGGC TGGATCTGTC CTCGATCAAG 
GTCGCACTGT GCGGCGGTGA GCCGATCGAG CCCGCGGCCA TCGAACGATT CCTCGACGCC 
GCGGCCCCGC ACGGCTTGGA CCGGAGCGCT TTCCTGCCCG CCTACGGTCT GGCGGAGGCG 
ACCCTGGCGG CCGCGATGCC TCCCACGCCG GGGCTGCGGT TCGACGAGAT CGACGCCGAC 
GTCTTTACTC AGCGGCGGGT CGCCGTTCCC GTCACCGTCC CTGGTGCTCC GGTGCGTCGG 
CTGGTCCGGC TCGGCCCACC GCTGCCCGGT CTAAAGGTCC GGCTCGTCGA CCCGGAGTCC 
GGGCAGCCGT GCCCGGAACG ATCTGTCGGT GAGATTTACA TCTCCGGGGA GTCCGTGACC 
TCCGGATACC TCGAAGGCAG CGACGCCGAG CTCGATCGGT GCAGCGGGGC TGGTGAGGCA 
AGCGAGGCCA GTGGGGTCAG GCACGTGGCG GACGGCTGGC TGGCGACCGG GGATCTGGGG 
TATCTCGTCG ATGGCGAGCT CGTAGTCTGC GGGCGCGCCA AGGATCTGAT CATCATTGGT 
GGAAGGAATC TGCATCCCGA GGAAGTCGAG GAGGCCGCCG CCCGGGTTCC TGGGGTTCGG 
CCAGGCAATG TCGTCGCCTA CCCCACCGCC CGTGACTCCG GCGCCGCCGA AGGGATGGCC 
GTCGCCGTCG AGACCCGAGG CGGCCACGAA GAGGCCACGA TCCGCGCCAG GGTGACTGCC 
GCTGTGCTGG CCGCAGTCGG GGTCCGACCG GTCCAAGTTC ATGTTCTGCC GCCCGGCAGC 
ATCCCCAAGA CACCGTCCGG GAAGTTGCAG CGCGCCAAGG CTGCCGGGAT GTTCGAGAGC 
CGACGATGA

Protein sequence

MMNLLEGIDR ARLQGGRVVF LDPDAEDGLS WSDFFVQAER VAAWLQAARG IGPSSRVVVL 
ATPSKAMVTA VVAVWMAGGS VTCAPTPART VDLPTYVDQT GKRIAALGDP LVLLGAPYEE 
LGETLATDGV RVDRLTDAVA AESAGAWKRP EITPDDPAIV QFTSGTTAAP KSVLISHGNL 
VANIAAIRER IRHDEVHGRL LSWLPLSHDM GLIGALAVQL TCGRCDVLFG TPADYLASPS 
SWLANAARYR ATILLGPASA YAMAGRLLAV GPRLDLSSIK VALCGGEPIE PAAIERFLDA 
AAPHGLDRSA FLPAYGLAEA TLAAAMPPTP GLRFDEIDAD VFTQRRVAVP VTVPGAPVRR 
LVRLGPPLPG LKVRLVDPES GQPCPERSVG EIYISGESVT SGYLEGSDAE LDRCSGAGEA 
SEASGVRHVA DGWLATGDLG YLVDGELVVC GRAKDLIIIG GRNLHPEEVE EAAARVPGVR 
PGNVVAYPTA RDSGAAEGMA VAVETRGGHE EATIRARVTA AVLAAVGVRP VQVHVLPPGS 
IPKTPSGKLQ RAKAAGMFES RR