Gene Franean1_2704 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2704
Symbol
ID	5671095
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3199252
End bp	3200889
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	71%
IMG OID	641241616
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001507036
Protein GI	158314528
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCGACA AGATCGAGAA AGAACCAACC CAGGCCGAGC AGGCCGTTAC CCGGAGGCGA 
CCGCTCTTCC CGCGGGCCTC CCCGGAGCGC GTGGCGCGCT ACCGGGCGGA GCGACTGTGG 
GACGACCGGG GTCTGGCGGA CGGTGTCGAG GCGGCAGCCG TCCGACGGCC GGACGCGCCG 
GCGATCGTGG ACAACGATCG GCGGCTCACC TATGCCGAGC TGAGCGGGGC CGTGGCCAGC 
GGGGTGGCGG CTCTGGCCGC ACGGGATGTG CGGGCCGGCG ACGGCGTGGT CCTCATCAGC 
GGCAACACCC GCCACGGAGT GATCGCTTAC CATGCCCTGC TGCGCACCGG TGTCACGGTG 
CTGGTGCTGG ATCGGCGCTG CGGTGTCGCG GACATACTGT TCGCCCTGGA CGCGCTCCCC 
GGTCGGGCCC GCGTGATCGT CCCCGCCGGG GAGAAAAACC GCCTCGACGA GGCACTGACC 
GCCGCCGAGG TTCTGCCGCT CGAACTGTTC GACGTCCAGC CGGCGCCCCT GGCCCCGCCG 
ACACGGACAC CGGCGGCGTG GGCCGAACCG GACCGCGACC GTGCCGCGGT GATCCTGTTC 
AGCTCGGGAA CCACCGGCAG GCCCAAGGGC GTCGTCCACT CGCTCAACAC GCTGACCGCC 
GGCACCGCCA ACATGGCGCG CGTCACCTCG ACCGACCTGA GCTCGGTGGT CTTCCTCGTC 
AGCCCGCTGA CCAGCATCAC CGGCCTGATG CAGATCCAGC TCGCAGCCGA TCAGCACGGC 
ACGCTCGTTC TGGAGGACCG TTTCCAGCCC GAGCAGACAC TGCAACGGAT GAACGCGGTG 
GGCGCGACCC TGTTGGGCGG CGCACCGGTC ATCGCCGAGC GGCTGCTGGC CGCCGCGACA 
TCCGCGGGAC CGGGCACCGG CGTCAGCCTG CGGACACTCG CACTCGGCGG CGCGATGCTG 
CCGCGCCCGC TGCTCGAGCT GGCCACGGAC ACGTTCGGGA TCGAGATCGC CCGGGTGTAC 
GGCTCATCCG AGGCGCCCAT ATTCTCGGGG AGTCTGCCGC TCGACGAGCG TGAGCGACGG 
CTGTCCGACG ACGGCGCGCT CATGCCCGGT GGCGAGATGC GTGCCGGCTC CACCGCTCAC 
CCGCGGGAAG GCCTCCTGCG AGGGCCGAGC GTCTTCCTGG GATATCTGGA CCCGGCGGAC 
GACGAGGCCG CGTTCGAGGA CGGCTGGTAC CGCAGCGGTG ATCAGATCGA GGTGCACCAG 
GGCAGGCTGA CCGTCGTCGG GAGGATCAAG GAGATCGTCA ACCGCAACGG CCTCAAGATC 
TCGCCGAGCG AGATCGACAC CGCCCTGGCG GGGTTGCCGG GGGTGCTTGA ACACGCCTCG 
TTCGGGCTCC CCGACCCATC GACCGGCGAA CGGCTCGCGG TCGCGGTCGC GGTCGCGGTC 
GGCAGCATCG TCACGCTCGA CGACGTCGTG GCGCATCTCC TCACCCGGGG GATAGCCAAG 
CGCAAGCTGC CGGAGCAGCT CGTGCGCTGG GACGGCCCAC TCCCCCGCAC CATCTCCGGG 
AAGGTCGTCC GATCCCGGCT CGTCATGGAG TCACCGGCGA AGGACAGCGA CCTGGCAGTG 
CGGCTGCGGG AGCACTGA

Protein sequence

MPDKIEKEPT QAEQAVTRRR PLFPRASPER VARYRAERLW DDRGLADGVE AAAVRRPDAP 
AIVDNDRRLT YAELSGAVAS GVAALAARDV RAGDGVVLIS GNTRHGVIAY HALLRTGVTV 
LVLDRRCGVA DILFALDALP GRARVIVPAG EKNRLDEALT AAEVLPLELF DVQPAPLAPP 
TRTPAAWAEP DRDRAAVILF SSGTTGRPKG VVHSLNTLTA GTANMARVTS TDLSSVVFLV 
SPLTSITGLM QIQLAADQHG TLVLEDRFQP EQTLQRMNAV GATLLGGAPV IAERLLAAAT 
SAGPGTGVSL RTLALGGAML PRPLLELATD TFGIEIARVY GSSEAPIFSG SLPLDERERR 
LSDDGALMPG GEMRAGSTAH PREGLLRGPS VFLGYLDPAD DEAAFEDGWY RSGDQIEVHQ 
GRLTVVGRIK EIVNRNGLKI SPSEIDTALA GLPGVLEHAS FGLPDPSTGE RLAVAVAVAV 
GSIVTLDDVV AHLLTRGIAK RKLPEQLVRW DGPLPRTISG KVVRSRLVME SPAKDSDLAV 
RLREH