Gene Franean1_3615 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3615
Symbol
ID	5671983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4285362
End bp	4287029
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	73%
IMG OID	641242500
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001507920
Protein GI	158315412
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1021] Peptide arylation enzymes
TIGRFAM ID	[TIGR02275] 2,3-dihydroxybenzoate-AMP ligase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGCCG GGTGCACCCC GTGGCCGGAG GAGGTGGCTC GCGGCTACCG GGAGAAGGGC 
ATCTGGCGGG GGCAGACGAT GGGCGCGCTG CTGGCCGATC TCGCCCGCCG CCACCGCGAC 
AGCACGGCGC TGATCCACCG CGACCGCCGG ATCAGCTACA CCGAGCTGGA CGCCTGGGCC 
GACCGGCTGG CCGCCGGGTT CGCCGCGCAC GGTGTCGCGC GCGGCGAGCG CGTGGTGGTG 
CAGCTGCCGA ACACGCCGGA GTTCATCGCG ATCGTGTTCG GGCTGTCCCG GATCGGCGCC 
GTCCCGGTGT TCTCGCTGGT CGCGCACCGG GCGACCGAGC TGACCCACCT GGTGCGGCTG 
TCCGGGGCCA CCGGATACGT GCTGCCCGAG TCCTACCGCG GCGTCGACCA CCTCGCCCTG 
GCCCGGCAGC TCCGGGCGGC GACCGACACG CTGCGGACGA TGTTCGTCCT CGGTGACGCC 
GCCGACGGCT TCGTCGCCCT CTCAGCGGTC GAGGCCGCCG GCGACGTCGG CCGCGTCGGC 
GCCGGCATCG CCGCGTACGA GGCCCCGCGG GAGCCCATGC CGCCGGCCGC CGACCCGTCC 
GACGTGGCGT TCTTCCTCCT CTCCGGCGGG ACGACGGCGT TGCCGAAACT GATCCCGCGC 
ACCCACGACG ACTACGTGTA CCAGTCCGAG CTGGCCGCCC AGGTGTGCGA GATGTCCGCC 
GATGACGTCT ACCTGGCCGC GCTGCCCGTC GAGTTCAACT TCGCCTTCGG CTGCCCGGGA 
GTGATCGGCA CGCTGCAGAC CGGCGGGACG GCGGTGCTCG CCGACACTCC GAACCCGCTG 
GACTGCTTCC TGCTCGTGGA ACGGCACGGC GTGACGGTGA CCGCGATGGT CCCCTCCGTC 
GTGGCGCTGT GGCTGGACGC CGCCGAGTGG AACGACGCGG ACCTGTCGAG CCTGCGCCTG 
GTCCAGGTCG GCGGCGCCCG GATGACCCGC GAGTTCACCG CCCGCATCGG GCCTGGCCTG 
GGCTGCTCGC TCCAGCAGGT GTTCGGGATG GCGGAGGGCC TGCTCTGCTT CAGCCGCCCC 
GACGACCCGG CCGAGGCGGT GCTGACGACG CAGGGCCGCC CGATCTCGCC CGCTGACGAG 
GTGCTCATCG TCGGGCCGGA CGGCGACCCG CTGCCCGGCG GCGAGATCGG CGAGCTGGTC 
ACCCGTGGTC CGTACACGCT GCGCGGCTAC TACCGGGTGC CGGAGTACAA CGCGCGGGCG 
TTCACCCCGG ACGGCTTCTT CCACACCGGT GATCTCGCCC GGCTGACCCC GGCCGGCGAC 
CTGGTGATCG AAGGCCGGAT CAAGGAAATG ATCATTCGGG GCGGGGACAA GATCTCGGCC 
GGCGAGGTCG AGGACCACCT GCTCGCCCAC CCCGGCGTCA CCGCGGCGGC CGTGACCGCC 
GTCCCCGACG ACCTGCTCGG TGAGCGGATC TGCGCCCACC TGATCGTCGA CGGGCCGGCC 
CCGTCGCTGG CCGAGCTCAA GCGGGCCATG CACGCGCGCG GCGTCGCCGA CTACAAGCTG 
CCCGACGCCG TCCGGTTCGT GACCGAGTTC CCGCTCACCC CGCTCGGGAA GATCGACAAG 
TTGGCGCTGG CCGCGGCGGC CGCGTCCGAA CGGAAGGCTG ACGTGTGA

Protein sequence

MLAGCTPWPE EVARGYREKG IWRGQTMGAL LADLARRHRD STALIHRDRR ISYTELDAWA 
DRLAAGFAAH GVARGERVVV QLPNTPEFIA IVFGLSRIGA VPVFSLVAHR ATELTHLVRL 
SGATGYVLPE SYRGVDHLAL ARQLRAATDT LRTMFVLGDA ADGFVALSAV EAAGDVGRVG 
AGIAAYEAPR EPMPPAADPS DVAFFLLSGG TTALPKLIPR THDDYVYQSE LAAQVCEMSA 
DDVYLAALPV EFNFAFGCPG VIGTLQTGGT AVLADTPNPL DCFLLVERHG VTVTAMVPSV 
VALWLDAAEW NDADLSSLRL VQVGGARMTR EFTARIGPGL GCSLQQVFGM AEGLLCFSRP 
DDPAEAVLTT QGRPISPADE VLIVGPDGDP LPGGEIGELV TRGPYTLRGY YRVPEYNARA 
FTPDGFFHTG DLARLTPAGD LVIEGRIKEM IIRGGDKISA GEVEDHLLAH PGVTAAAVTA 
VPDDLLGERI CAHLIVDGPA PSLAELKRAM HARGVADYKL PDAVRFVTEF PLTPLGKIDK 
LALAAAAASE RKADV