Gene Franean1_4940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4940
Symbol
ID	5673279
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	5930417
End bp	5931808
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	74%
IMG OID	641243794
Product	putative secreted protein
Protein accession	YP_001509210
Protein GI	158316702
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACGG TGGGAACGCC GTCCGCAGCA CCTGCCGCCG GTAACCCGGC TCCCGTGTCC 
GGCTCGGCGA CTGCTGTCTC CACGGTTTCG GGCGCCGCGG CCTCCGTCGC CGCGGCGGCG 
GGGACGATCC GGCGACGGAG CCGGACTCCA CCCGGATTCC TGCGCCTGCT GTCCGCCGGG 
CTCGTAGGTG TCCTGATGGT GACGTTGTCC GTCTGCCTGC TGTCCACCCT CTCCCGCCAG 
CACGCCGTGG ACGCCCTCGC CCGCGACTCC GGTGCGTCGT TCGTGGCGGC GCAACAGCTG 
CACGCCGAGC TCTCGGTGGC CGACGCGACC GTGGCCCGCG CGTTTCTGGC CGGCGGCGTG 
GAGCCGCCGG CCCAGCGGAC GGCCTACCAG GAGAGCATCG CCTCGGCGAG CGGGCGCATC 
GTCGACCTGG CGCTCGCCGG CGGGCCGCGC GAGCCGCTGA GCGTCCTGGC GGCCCAGCTG 
CCGGTGTACA CCGGCCTGAT CGAACGGGCG CGCGCGAACA ACCGGATCGG GAATGTCGTC 
GGCGGCGCGT ACCTTCGTCA GGCCTCCGAA CTCATGCAGA CCAGGATCCT CCCAGCGGTC 
GACCGGCTGG CCGCCGAGGA CGCGCTGGAC ATCGATCGCG GGTACGCCCA GGCGACGCGC 
TGGTACCAGC CGGTCCTCGT CGGCGTGGCC GGCGCGGCGG CGCTGGCGGC CCTGGTCGCC 
CTGCAGATCC GCCTGTTCCG GCGGACGCAC CGGATGTTCA ATCTGCGCCT GGTCGCCGCG 
ACGGTACTGG TCGTGATCGC GACGGGTCTC ACCCTGCTGG CTTTCGGTGT CTCCCGGGCC 
CGCCTGGTCG ACAGCAGGAA CGACGCCTTC CGGCCGATGA CGGTCGTCGC CCAGGTGCGG 
GTGCTGGCGC TACGGGCCTG GGGCGACGAG AGCCTCTCCC TGATCGCCCG CGGCAACGGC 
GACGACCTCG ACGCCGACGC GCGCCGGGTG ACCGAGCGCC TCGGCTACGA CCCGGCGGGC 
CGACCCGCCG GCGCGGGAGG GCTCGCCACC GCCGCGGCGC TGGACGGCCC GGACGCGCCG 
GGACGGGACG TGCTCGTACC CGACTGGGAG CGCTACCAGG ACACCGCCGT CCGGGTCCGG 
GACCTGGTCC GCGACGTCGG CGGCTTCCAG GAGGCCGTAC GGGTGGCCCT CGACGAGGGA 
ACCTCGACGT TCACCCGCTT CGACGGCGAC GCCGAGACGG CGTTCACCGC GAGCCGCGAG 
CGTTTCGCCG CCGGGCTGAG CTCCGCCGCG GGCACCTACG ACGGTGTCGC CGCCGGTACC 
GGCACGGCGC TCGGGCTGGC GATGCTCCTC ACGCTGGCCG GGGTGCAGTC GAGGATCAAT 
GACTACCGTT GA

Protein sequence

MSTVGTPSAA PAAGNPAPVS GSATAVSTVS GAAASVAAAA GTIRRRSRTP PGFLRLLSAG 
LVGVLMVTLS VCLLSTLSRQ HAVDALARDS GASFVAAQQL HAELSVADAT VARAFLAGGV 
EPPAQRTAYQ ESIASASGRI VDLALAGGPR EPLSVLAAQL PVYTGLIERA RANNRIGNVV 
GGAYLRQASE LMQTRILPAV DRLAAEDALD IDRGYAQATR WYQPVLVGVA GAAALAALVA 
LQIRLFRRTH RMFNLRLVAA TVLVVIATGL TLLAFGVSRA RLVDSRNDAF RPMTVVAQVR 
VLALRAWGDE SLSLIARGNG DDLDADARRV TERLGYDPAG RPAGAGGLAT AAALDGPDAP 
GRDVLVPDWE RYQDTAVRVR DLVRDVGGFQ EAVRVALDEG TSTFTRFDGD AETAFTASRE 
RFAAGLSSAA GTYDGVAAGT GTALGLAMLL TLAGVQSRIN DYR