Gene Franean1_2695 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2695
Symbol
ID	5671086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3189088
End bp	3190638
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	66%
IMG OID	641241607
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001507027
Protein GI	158314519
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCCGG GCTTCTACGC CGAGAAGGAC CCCGCCAAGC CGGCCGTAGT GCTCTGCCCG 
GCCGGAGAGC GGGTCAGCTA CGGATCGCTG GAGGCACGGT CCCGCCAGTT CGCCCGCGTG 
CTCCGAGCCC GCGGACTGCG GCCCGGCGAC ACGGTGGCCC TCCTGGCCGA GAACCACGCG 
CGCTACCTGG AGGTGTACTG GGCAGCGATC CGCTCCGGGC TCTACCTGAC GGCGGTCAAC 
TGGCACCTGA CCGCGGCCGA AGCCGCCCAC CTGCTCGGTG ACTCCGCAGC ACGCGTACTC 
GTCACTACCG CCCGGTTCAC CGACCTGGCC CGCACGGCCG CGGATCTCAG CCCGACCTGC 
TCAACGCTCC TCCTCCTGGA CGGGACCGAG GACGGCTTCG AATCGTACGA GGAAGTGATC 
GCGGCCCAGT CCGCCGCACC GCTCGCCGAC CAGCCAGCCG GCGACGTCAT GCTCTACTCC 
TCCGGCACGA CCGGACGCGC CAAAGGCATC CGACGCCCGC TGTCCGACCT GCAGGTGGAC 
CAGCCCGGCC GCCCCAGTGC CTCTCCGATG GCAAAGGCAT TTCTCGGAAT CGGCGAGGAC 
TCGACATACC TAACCCCGGC GCCGCTGTAC CACGCAGCTA GCCTGCACTG GGCAGCCGGC 
GCCCACGAGC TCGGCGCGAC ACTCGTCATC ATGGACCGCT TCGACGCCGA ACAGATGCTT 
GCCGTTATCG AAAAAGAACG AGTCACCCAC GCCCAAGTCG TCCCCACGAT GATGATCCGC 
CTACTGAAAC TCCCGGCCGA AGTACGAACG AGATACGACG TCTCCAGCCT CCGCTCATTG 
ACACATGCGG GAGCACCCTG CCCCCCGGCC ATCAAACGTC AGATGATCGA CTGGCTCGGC 
CCGATCGTCG ACGAGTACTA CTCCAGCACT GAAGGCTCCG GTATGACGTT CATCGGCTCC 
GCCGACTGGC TGGCACATCC GGGATCTGTC GGCAGAACAA TCATCGGCAC CCCGCACATC 
TGCGACGACA ACGGTAGGGA GCTACCGGTA GGCGAGCCCG GGCTGCTGTA CTTCGACCGG 
GGGACGGAGC ACTTCGAATA CCACAACGAC CCCGAAAAGA CTCGCGAGGG CCGCCACCCC 
AAGCACCCGA CCTGGACGAC CTCCGGAGAC ATGGGCTACG TCGATACCGA CGGCTACCTA 
TACCTGACGG ACCGCAAAAG CTTCATGATC ATATCCGGAG GGGTCAACAT CTACCCCGCC 
GAGATCGAGG CCGCCCTCAT CCTGCACCCC GCCATCACGG ATGTCGCCGT CTTCGGCCTT 
CCGCACGCCG ACATGGGCGA ATATGTCCAC GCCGTCGTTC AGCCCACGGA CGGCGTCGAC 
GCCACACCCG AACTCGCCGA GCAAATCCGC GCGTTCGCCC GCGACCACCT CGCCGGCTAC 
AAGGTCCCCC GAGCAATCAC CTTCCGCGAC CAGCTACCGC GCATGTCCAC CGGCAAACTC 
GCCAAGAACG CCCTGCGCCA GGAATACCTC GGTGCTGCGC TACCGCGGTA G

Protein sequence

MYPGFYAEKD PAKPAVVLCP AGERVSYGSL EARSRQFARV LRARGLRPGD TVALLAENHA 
RYLEVYWAAI RSGLYLTAVN WHLTAAEAAH LLGDSAARVL VTTARFTDLA RTAADLSPTC 
STLLLLDGTE DGFESYEEVI AAQSAAPLAD QPAGDVMLYS SGTTGRAKGI RRPLSDLQVD 
QPGRPSASPM AKAFLGIGED STYLTPAPLY HAASLHWAAG AHELGATLVI MDRFDAEQML 
AVIEKERVTH AQVVPTMMIR LLKLPAEVRT RYDVSSLRSL THAGAPCPPA IKRQMIDWLG 
PIVDEYYSST EGSGMTFIGS ADWLAHPGSV GRTIIGTPHI CDDNGRELPV GEPGLLYFDR 
GTEHFEYHND PEKTREGRHP KHPTWTTSGD MGYVDTDGYL YLTDRKSFMI ISGGVNIYPA 
EIEAALILHP AITDVAVFGL PHADMGEYVH AVVQPTDGVD ATPELAEQIR AFARDHLAGY 
KVPRAITFRD QLPRMSTGKL AKNALRQEYL GAALPR