Gene Franean1_5085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5085
Symbol
ID	5673420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6085177
End bp	6086601
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	78%
IMG OID	641243936
Product	hypothetical protein
Protein accession	YP_001509350
Protein GI	158316842
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0309888
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000681327
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCCGGCGG ACCCCGGCCC GCCTTCCGCG CAGTCCTCGA GCGAAGGCCC CGAGGCGGTC 
CGCGTGCCCG AGGAACCCGA GCCCGAGAAA CCCACGCCCG TTGAACCCGC GGACGACGCC 
GCGGCGGTGA CCGCCTCCGG CCTGCCGCCG GCCAGCGACC CCTCTGCCGG CGCCCCGCCT 
TCCGGCCACC AGCCTTCCGG CGACCCGCCC GCCGAGCACA CGCCCGCGGG CGACCCGCCC 
GCTGCCGACG GTCCCTCGGG GGGCATTCCC TCGGTCGACG GTCCCTCGGG AGAGGACCCC 
CTGCGAGAGG GCATCCTGGA CGAGGACCCC CTGGGCGGCT CTCCTCCGGA CGACGGTGCT 
GCCGCTGATC CCTCAGCCGC CGATCCCGCG GATCCCACAG CATCCACCGG GTCCGCGGAT 
TCCGCGGATT CCGCCGGGCC CACGACGTTC GTCCGGCCTA CATCGGCCGC CGGGCCCGCG 
CCGTCCGCGG GGCCCGCTGA GCCCGCGGGT GACGTGCCCG GCGACGGCTC CCCGCCGGGC 
GGGTTGGGAC GCTCCGTGAT CCGACTGCTC GACCGGGTCG ACGCCGCCGC CCTGCCGCCG 
GTCGGCCGGG TGCTGGAGTC GGTCGCCGGC GGCCTCGCCG GCGCACGCGA CCGCCCTCGG 
GCGCGCCTGC GCCGCGCGTG GGCGGCACGC GTGGGCCCGT ACGCCGACGG CGACGGCCCC 
CCGCCACCGG GCCGGGCCAG CGTCATCACC GGGCGCGCCC TCGAGGCCAT CGGCCGGCTG 
CTCGTGCTCG GGCTGGTCGT GCTGATCGTC GTCGGTGCCG TGACCACGAT GCTGCGCGGC 
GCCGATCCCT CGGGCAGCCA TGCACCCGGC CCCGGTCCCG GCAACGCTCC GGCCGGGCCC 
GTCGAGCCCA CGGTCACCGT CGGCCCGGCC GCGGGTGAGT CGCCCGCCGC GTACGCCGCC 
GAGGCCGAGG CGAAGCTGGA CGGCCTGACC CGGGCGGCCC CGGACGCCGA CCTCTACGCC 
GTCGTCAGCC TGGCCGGCTA CCGCACGCCG GACGAGATGC TGCAGATCTT CACCGCCTAC 
CGCACGCTCG AGGTGTTCTT CGGCGTCCCG CCGGACGGGG CGGTGATGGC CGCCACCGTC 
CGCGACCCGG TCGCGGACCT CACCGCCGCC TTCGACAGCG AGGCCGACGC CGCCGACACC 
CGCGCGCACA GTGCCACGGA CCCCGCCGAG GCCGAGCACG CGCGGCAGGA GGCCACGGCG 
CTGCGCGCGC GGTGCGGCTG CCTGTTCGGC GCGGTCGTGC GGGCGCCGGC GGCCCGGCTG 
GTCGACCTCG GACACATCGA GGGGGTGCGG GTCGTCGACC CGGCCCCGCC CGGCATCTCC 
CCGGAGACCG TGCGCTTCCT CCCGCTGCAG CCCGACCAGC GCTGA

Protein sequence

MPADPGPPSA QSSSEGPEAV RVPEEPEPEK PTPVEPADDA AAVTASGLPP ASDPSAGAPP 
SGHQPSGDPP AEHTPAGDPP AADGPSGGIP SVDGPSGEDP LREGILDEDP LGGSPPDDGA 
AADPSAADPA DPTASTGSAD SADSAGPTTF VRPTSAAGPA PSAGPAEPAG DVPGDGSPPG 
GLGRSVIRLL DRVDAAALPP VGRVLESVAG GLAGARDRPR ARLRRAWAAR VGPYADGDGP 
PPPGRASVIT GRALEAIGRL LVLGLVVLIV VGAVTTMLRG ADPSGSHAPG PGPGNAPAGP 
VEPTVTVGPA AGESPAAYAA EAEAKLDGLT RAAPDADLYA VVSLAGYRTP DEMLQIFTAY 
RTLEVFFGVP PDGAVMAATV RDPVADLTAA FDSEADAADT RAHSATDPAE AEHARQEATA 
LRARCGCLFG AVVRAPAARL VDLGHIEGVR VVDPAPPGIS PETVRFLPLQ PDQR