Gene Franean1_5429 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5429
Symbol
ID	5673760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6567871
End bp	6569448
Gene Length	1578 bp
Protein Length	525 aa
Translation table	11
GC content	73%
IMG OID	641244284
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001509690
Protein GI	158317182
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.308842
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTCGA CCGGCGACGA GATCCGACCG ACCATCCCTG ACCTGTTGGG GCGCTGCGCT 
CGGGAGTTCG GCTCCGCCGA CTACATCGTC TCCCTCACCG ACCGGCTGAC CTACGCCGAG 
GCGGAGGAGC AGTCCGCCCG GGTGGCCCGG TGGCTGTTGC ACGAGGGCGT CGGTAAGGGC 
ACCCGGGTGG GCCTGTTCTT CCCCAGCGGC GTCGAGTGGG CCCTCTGGTG GCTGGCCGTG 
AGCCGGATCG GGGCCGTGGC CGTTCCGCTC AGCACCCTGT ACCCGCCGGC GGAGATCGCC 
AAGGTCGTGC GGCTGGCCGA TGTGCAGCTC CTGGTGGCAC CGACGACCGT GCTGCGGATC 
GACGTCGCGC AGCGGTTCGA GGCGGCGTTC CCCGAGCTGG CCGGGCAGCT GGCCGGGCAG 
CCGGCCGGCC AGCTCGAGCT GGCGGGCGCG CCGTACCTGC GGCGGATCGT GCTAACCGGC 
CAGACGGACC GGGGCTGGGC CACCCGGTGG GATCCGCGGG ACCCGCCGCT GGTGCGGGCC 
GAGCTGCTCG CCGCGGTGCA GACCGAGGTC ACCCCGGCCG ACCTGGCGAT CATGGTTCAC 
ACCTCCGGTT CCACCGCCGA CCCGAAGGGC GTGCTGCACA CGCACGGCAC GCTGGTGCGC 
CAGACCTCCA CCTGGCCGGC GGCGATCCGC GGGCTCACCG GCGTCGACCA CGCGCCGCGC 
ATCCTGTGTG CCATGCCGTT CTTCTGGATC GGCGGGATCC TGGCCGCGAC CGGAGCTCTG 
CACGCACCCG TCGCGGTCCT GGTGCTGGCG CGGCTGGAAG CCGGGCCGGC CCTCGACCTC 
GCCGAACGGG AACGGGCGAA CGGCGTCGTC GGATGGCCCG CGTTCACCCA GCAGCTGCGG 
CTGCACCCGT CCTTCCCCAG CCGGGACCTG CGCAGCGCCC CCGCGCTGCG GGAGGGGCCG 
GTGGACCTCG CGATGGCGGG CGTCCCGGAC GGCCATCCGA TCCACCGCAG CCTGACCGAG 
TCCGGCGGCA GCTTCGCGTT CACCGAGACC GCGATCGTCG ACGCCGCCGG CGAGCGCGTC 
CCGGACGGGA CCGTCGGTGA GCTGCTCATC CGTGGCATCG GCTCGATGGC CGGCTACAAC 
AAGCGTGAGC GCGCGGAGGT CTTCGACGCG GACGGCTGGT ACCACACCAG CGACCGCGTC 
TACCGCAGGA CGGGCGACCC GCGGCTGTTC TACGTCGGCC GGGACAGCGA GCTCGTCAAG 
GTCGCCGGTT CGAACGTGGC ACCGCGCGAG GTCGAGGCCG TCATCGAGGA GTTCCCCGAG 
GTCGCGCACT GTGTCGTGAC CGGTGTCGAG CATCCGACCC GCGGCGAGGA GGTGTGCGCG 
GTCATCGTTC CGGCCGGCAC GACCGGCACG GACGTCGACG TGGACGGTCT GGCCGCGCGC 
ACCCGTACGC TCCTGTCCAG CTACAAGGTT CCGACCCGGT GGATCGTCGC CGCGGACGAC 
GAGGTGCCGG CCCTGCCGAG CGGCAAGCCG GACCGCCGCG GCCTGCGCAC ACTGATCGAG 
GACGGCCGAC TGAAGTAG

Protein sequence

MTSTGDEIRP TIPDLLGRCA REFGSADYIV SLTDRLTYAE AEEQSARVAR WLLHEGVGKG 
TRVGLFFPSG VEWALWWLAV SRIGAVAVPL STLYPPAEIA KVVRLADVQL LVAPTTVLRI 
DVAQRFEAAF PELAGQLAGQ PAGQLELAGA PYLRRIVLTG QTDRGWATRW DPRDPPLVRA 
ELLAAVQTEV TPADLAIMVH TSGSTADPKG VLHTHGTLVR QTSTWPAAIR GLTGVDHAPR 
ILCAMPFFWI GGILAATGAL HAPVAVLVLA RLEAGPALDL AERERANGVV GWPAFTQQLR 
LHPSFPSRDL RSAPALREGP VDLAMAGVPD GHPIHRSLTE SGGSFAFTET AIVDAAGERV 
PDGTVGELLI RGIGSMAGYN KRERAEVFDA DGWYHTSDRV YRRTGDPRLF YVGRDSELVK 
VAGSNVAPRE VEAVIEEFPE VAHCVVTGVE HPTRGEEVCA VIVPAGTTGT DVDVDGLAAR 
TRTLLSSYKV PTRWIVAADD EVPALPSGKP DRRGLRTLIE DGRLK