Gene Franean1_7048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_7048
Symbol
ID	5675359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	8601130
End bp	8602725
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	74%
IMG OID	641245894
Product	transposase IS66
Protein accession	YP_001511285
Protein GI	158318777
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.652427
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTGTCG CGGTCGAGGG TGATGGCGTG ACGCTGGCGG GGGTGCTGGC GGAGAACGCC 
TGGCTGCGTG GCCAGTTGGC CGAGCGGGAC GCCGAGATCG CGGCGCTGCG GGCGCGGGAC 
GCCGAGCGGG AGACCGAGCT TGAGGCGTTG CGGGCGGAGC TCGTGGTGCT GCGGAAGGTC 
GTGTTCGGTC GGTCGTCGGA GAGGGGCGCC GGGCCGGCGC CTGCGCCGGC GGGGCGGGAT 
GGCACGGACG GTGGCCAGCT GGCGGGCGGT CGGGAGGCCG CGGGCCGGGA GGCGCCGCGG 
CGTGGGCCGG GGGCGCGGGC GGGTCGGCGG GACTACGGCG GTCTGCCGCG CCGGGATCTC 
GACTGTGACT TCCCCTCGGG TGGCTATGCC TGCCTGGAGT GCGGGACGCT GTTCACGCCG 
TTGGGTGAGC ACCGGGTCGA GCAGGTGGAC TGGCGGGTGC TCGTCGAGCT GCTGGTCTCC 
CACCGGCGCC GCTACCGGCG GGGGTGTGGC TGCGGCGGGC CGGTGACGGT GACCGCGCCG 
GGCCCGTCGA AGGCGGTCGG GCGGGGCCTG TTCACCAACC GGTTCCTCGC GATGCTGCTG 
GTGGAGCGGT ATGTCGCGGG CCGGTCCCAG AACTCGCTGG TCACCGGACT GGCACGCCAC 
GGCGCCCAGA TCTCGCCGGC GACCCTGACG GGGGCGTGCG CGCAGGTCGC GGGCCTACTC 
GCCCCGCTCG CGGAGAAGAT CGTCGCCCGG TCGCGGGGGT CGTGGCACCT GCACGCCGAC 
GAGACGACCC GGCGGGTGTT CACCCCGGAC AGCGCCGGCG GGCCGGCCCG CCGGTGGCTG 
TGGGTGTTCC TCGGCCCGGA CTCGGTGTGC TTCGTGATGG ACCCGTCCCG CTCGGCGGCG 
GTGCTCGCCG GGCATGCCGG GATCAGCGAG GCCACCGGCC AGCTCGACGG GGACGACGGC 
GCCGGCGGCC CGCGCCAGCT GGTGATCTCC TCGGACTTCT ACGCCGTCTA CGCCTGCGCT 
GGCCGCAAGG CGGACGGGAT CGTCAACCTG TTCTGCTGGG CCCACGTCCG CCGGTACTTC 
ATCCGGGCCG GGGACGCGAA CCCCGCCCAG CTCGGGATCT GGGCCCGCCA CTGGCGCGAG 
CAGTTCGGCG CGCTCTACCA AGCGCACGCC GAACTCGCCG ACGCCTGGCA GACCGCGGCC 
AGCGCCCCGA GCCCGGCGGC CGAGCGCCGC CTCGCCGCCG CCCACGCCAC CTGGGACGCC 
GCGATCGGGG CGATCGACAC CGCCCGCCGC GAGCAGACAG CCTCCCCCGG CCTACAGGAA 
CCCGCGAAGA AAGCCCTGGC CACGATGGAC CGGGAATGGG ACGGGCTGAT CGCCCACCGC 
GACTACCCCA TGATCGGGCT GGACAACAAC CCAGCCGAGA GAATGATCCG CAAACCGGTG 
ATCACACGGC GCAATACCGG CGGCTCCCGC ACCGACGACG CCGCCTGTCG GCATGCCCAC 
ACGCAACTTC CGACTACTTA CGTGAAGAGT GAAGAGAAGG TTTTCGGGTC GCCCTCGGGT 
CGGGCATCCT CATCGCAGGG CCGGCCAGGG AGGTGA

Protein sequence

MGVAVEGDGV TLAGVLAENA WLRGQLAERD AEIAALRARD AERETELEAL RAELVVLRKV 
VFGRSSERGA GPAPAPAGRD GTDGGQLAGG REAAGREAPR RGPGARAGRR DYGGLPRRDL 
DCDFPSGGYA CLECGTLFTP LGEHRVEQVD WRVLVELLVS HRRRYRRGCG CGGPVTVTAP 
GPSKAVGRGL FTNRFLAMLL VERYVAGRSQ NSLVTGLARH GAQISPATLT GACAQVAGLL 
APLAEKIVAR SRGSWHLHAD ETTRRVFTPD SAGGPARRWL WVFLGPDSVC FVMDPSRSAA 
VLAGHAGISE ATGQLDGDDG AGGPRQLVIS SDFYAVYACA GRKADGIVNL FCWAHVRRYF 
IRAGDANPAQ LGIWARHWRE QFGALYQAHA ELADAWQTAA SAPSPAAERR LAAAHATWDA 
AIGAIDTARR EQTASPGLQE PAKKALATMD REWDGLIAHR DYPMIGLDNN PAERMIRKPV 
ITRRNTGGSR TDDAACRHAH TQLPTTYVKS EEKVFGSPSG RASSSQGRPG R