Gene Franean1_4026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4026
Symbol
ID	5672384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4801095
End bp	4802558
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	72%
IMG OID	641242902
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001508319
Protein GI	158315811
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.863411
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.734858
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACGACA CGGTCAGCTA CGCACGGCGG ATTCGAGAGC TCGTCGGTGA GCGCCCCGAC 
GAGATCGCGT TACGCCACAT CGCGCTGGAC GGCGCCGAAC CGGCGTTCAC CTGGGCCGAG 
CTCGACCGGC GCTCGGGCCA GCTCGCCGGT GCCCTCGCGG TCCGCGGGCT CGGCCCCGGC 
GACCTGCTCG GGCTGGGGCT GCGCAACTCG CCGCAGTTCG TGTTCAGCGC GCTGGCGGCC 
TGGAAGCTGG GCGCCGTGCC GGTGCCGGTG CGCTGGGACC TGCCGGACTG GGAGTTCACC 
CGGCTGCGGG AGACCGTCGA CGCGCCGGTG TTCCTCGGGC CCGAGGACAT CCCGTGGATC 
GACGCGACGG CCGACCTCGC CGTCCCGGAC CTGCCCGACG CGACGTCGCC GCAGACCAAC 
GGCATCTGCA GCAGCGGCTC GACGGGCACG CCGAAGGTGA TTCTCAACGC GCGGCCGGCC 
GTCTTCGACG CCCGTGCCAC CGCGCCGTTC GTCGACCAGT GGAGCCCGGT ACCGCGGCCG 
CAGGTGATCC TGGTACTCGC CCCGATGTAC CACGCCAACG GGTTCTCCAC CCTGTACAAC 
CTGCTGGCGG GGGACAGGCT GGTGGTGATG GAGAAGTTCG ACGCCGCCCG GGTCGTCGGC 
GTGATCGAGC GCCACCGGAT CAGCACGTTC ACCGCCACCC CGACCATGCT GCAGCGCATC 
GGCGACCTGC CGGACGTCGA CGGCCGCGAC CTGTCCAGCA TCGAGTGGAT CATGCAGGGT 
GCGGCGCCGA TGCCGCCGTC GCTGGTGCAC CGGTGGGCCG GGCTGATCGG CGCCGAGCGC 
ATCGTGATGG CCTACGGGAT GACCGAGGCA CTCGGTATCA CCGCACTGCG CGGCGACGAG 
TGGATGTCCA GGCAGGGCAG CGTGGGCCGT GGCTTCCGGG GCACCGAGGT CCGGATACTG 
GGCGCCGACG GCGAACCGGC GCCGGCCGGT GAGATCGGCG AGATCTACCT GCGCGCGCCG 
CGGTCGAGCT ACGGCGGCTA CACCTACCTC GGCCAGGCCC CGCGGCTGCG TCGCACCGAC 
GACGGCTTCG AGACCGTGGG TGACCTCGGC TACCTCGACA CCGACGGCTT CCTGTACCTG 
GTGGACCGCC GGGTCGACGT GATCATCACC GGCGGGGCGA ACGTCTTCCC GGCCGAGGTC 
GAGACGGCGC TCATCGACCA TCCCAAGATC GCTGACATCG TCGTCATCGG GCTGCGGGAC 
CCGGAGTGGG GCCGGCGGGT GCACGCCGTC GTGCAGCCCG CCGACCCGGC CCAGCCTCCG 
TCGTCCGCGG AGGTCATCGC CTACGCGAAG AGCCGGCTCG CCGCCTACAA GGTGCCCAAG 
ACGATCGAGA TCGTCGAGGC GCTCCCGCGC AGTGAGGCGA CGAAGATCAA CCGTGGCGCG 
CTCGTCGAGG CCCGCGGCGG CTGA

Protein sequence

MDDTVSYARR IRELVGERPD EIALRHIALD GAEPAFTWAE LDRRSGQLAG ALAVRGLGPG 
DLLGLGLRNS PQFVFSALAA WKLGAVPVPV RWDLPDWEFT RLRETVDAPV FLGPEDIPWI 
DATADLAVPD LPDATSPQTN GICSSGSTGT PKVILNARPA VFDARATAPF VDQWSPVPRP 
QVILVLAPMY HANGFSTLYN LLAGDRLVVM EKFDAARVVG VIERHRISTF TATPTMLQRI 
GDLPDVDGRD LSSIEWIMQG AAPMPPSLVH RWAGLIGAER IVMAYGMTEA LGITALRGDE 
WMSRQGSVGR GFRGTEVRIL GADGEPAPAG EIGEIYLRAP RSSYGGYTYL GQAPRLRRTD 
DGFETVGDLG YLDTDGFLYL VDRRVDVIIT GGANVFPAEV ETALIDHPKI ADIVVIGLRD 
PEWGRRVHAV VQPADPAQPP SSAEVIAYAK SRLAAYKVPK TIEIVEALPR SEATKINRGA 
LVEARGG