Gene Franean1_5862 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5862
Symbol
ID	5674185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7111210
End bp	7112787
Gene Length	1578 bp
Protein Length	525 aa
Translation table	11
GC content	80%
IMG OID	641244712
Product	hypothetical protein
Protein accession	YP_001510114
Protein GI	158317606
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000662704
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.168546
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGCGGA TCGTGGTGCC GGCCGGGGTG GCGTGCCTGG TCGGGGTGGT CGCGGCCCTG 
CTCACCACGG CGGGGCCTCG TCCGCCCGCA GCCGTCCCCA GACCGGTCAC CGCGGCCACC 
CTGGACTGCC CGGATCTCGG CCTGAGGGGG CAGGTGCCCC AGCTGCTGGA CGTCGTGCGC 
GGCTCGGGGC CCGACGGGGT GGTCCGGCCA TCCGGTGGCG GCGCGCTGCT CGGCGGCGAC 
CGCCAGCACG ACGAGCTGCT CTACCTGCCG CGTCCAGACC CGGGTGGCCC AACTCCGGGC 
GGCCCGGCTC CGGGCCGCAC GGACCTGGAC GGGCCGGACA GCGGCCAGTC GGTGGCACGG 
GGGCCTGCCG GCGGTCCGTT GCGGCTTGTC GCGACCGGGT CCGCCGCGGC CGGCCTCACC 
GCGACCGTGA CCTCCCCCGG GTCGGGAGCG GGACCGTTGC GAGCCCGCTG CGAGCAGTCC 
CGCGCGCGGA CGTGGTTCGC CGGCCCGGCC ACCGTCGCCG GCCGCGATCC CGTCCTGTAC 
TGGACGAACA CCGGTCCGCG GCCGGCCCGG GTCAGTGTGG GCGCCGTGTC GTCGGGCCAG 
ACGGCGCCCC GGGTGGAGGT GACCGTTCCG GTCGGGCGCA CGGTCAGCCG GCGCCTGGCC 
GAGCTCGCCC CCGAGGCGAC CGTGACCACC GTCGACGTCG ACGTGCACAC CGGCCGGGTC 
CTGAGCTGGA TGGTCGACCG CGCGAGCGGC TCCGGGCCGG CGGCGGCCAC GCCCGTGCCG 
CCGACCGCCG GTCCGGCCAC CCGGGTCCTG CTCGGCGGGT TCCTCACTCC TGCCGGGTCC 
GGCGGTACGG GGGCACCGGC CGCCGGCCCG CCAACGGCCG ATCTCGTGCT CTCCGCTCCC 
GGAGCGGCGG CGACCGTACG CGTCAGTGTG ATCACGGCCT CGGGTCGCCA CACCCCGGTC 
GGCCTGGAGG CCGTGCGGAT CCCGGCCGGC GCGGCGCTGC GCCGCCTGGT CACGCTGACT 
CCGGCGAGTC CGTCCGCCCT GCTGGTCGAG TCGACGGACG GGGGCGGGAT CGTCGCGGCG 
CTCGGCCTGC CCACCGGCGT GGCCGCGGCG GCCCCCGCGG CGCCGGGCAG CGGTCCGCCG 
AACGGGCGTA CCTGGGTCGC CGGGGTCGTT CCGGAGCGGC CCCGCTGGGC GGGCGTCGTC 
GTCGGCGACC CGGGCGCGGC CGGGCCGACA CCGCCGGGTC TGGTCGTCGC GGCGGCGCCG 
GTACCGGCCT GGACGGCCGG CGCGCTCGTC CTGGTGGCGC CCCGGCGGGC CGCCACCGTC 
TGGGTCGACG GCCGCCGGTT CGAGGTCGGC GCGGGTCGCG CGGTGCTGGC GCCGCTGCCG 
GCGGGCCGCG TCGGCGCGCG TGTCGTCGGC ACCGGCGGCC CGCTCGTCGC GAGCCAGGTC 
CTCGGCACCG CGCCGCCGTC CGCGGGAGTG GTGACCGCGC TGGTGCCGCG GACCGTCTCG 
GCCGTCGTGC CGCTTACTGG CGCGTGGCGC CTCCGGTACG GTCCGGCGTC GCTGGCCGAT 
CCGCGCGTCG CCTGGTGA

Protein sequence

MKRIVVPAGV ACLVGVVAAL LTTAGPRPPA AVPRPVTAAT LDCPDLGLRG QVPQLLDVVR 
GSGPDGVVRP SGGGALLGGD RQHDELLYLP RPDPGGPTPG GPAPGRTDLD GPDSGQSVAR 
GPAGGPLRLV ATGSAAAGLT ATVTSPGSGA GPLRARCEQS RARTWFAGPA TVAGRDPVLY 
WTNTGPRPAR VSVGAVSSGQ TAPRVEVTVP VGRTVSRRLA ELAPEATVTT VDVDVHTGRV 
LSWMVDRASG SGPAAATPVP PTAGPATRVL LGGFLTPAGS GGTGAPAAGP PTADLVLSAP 
GAAATVRVSV ITASGRHTPV GLEAVRIPAG AALRRLVTLT PASPSALLVE STDGGGIVAA 
LGLPTGVAAA APAAPGSGPP NGRTWVAGVV PERPRWAGVV VGDPGAAGPT PPGLVVAAAP 
VPAWTAGALV LVAPRRAATV WVDGRRFEVG AGRAVLAPLP AGRVGARVVG TGGPLVASQV 
LGTAPPSAGV VTALVPRTVS AVVPLTGAWR LRYGPASLAD PRVAW