Gene Franean1_1784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1784
Symbol
ID	5670186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2144215
End bp	2145342
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	66%
IMG OID	641240705
Product	IS605 family transposase OrfB
Protein accession	YP_001506128
Protein GI	158313620
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.125878
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.304536
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGCGGG CCTACAGGTA CCGCTTCTAC CCGACTGTCG AGCAGGCCGA GCAGTTGGCG 
AGAACGTTCG GCTGTGTGCG CTACGTGTAC AACCGGGCGT TGGCGGAGCG GCACCGGGTC 
TGGTTCCAGG AGCAGCGCCG GGTCACGCAT GCCGAGACGG ACAAGATGCT GACGGCGTGG 
AAACGCGACC CGGAAACGGC GTGGCTGGCC GAGCCGTCGA AGGGGCCGTT GCAGGCGACG 
CTGCGGCATC TGCAGACCGC CTACGTGAAC TTCTGGGAGA AGCGGGCCGG TTACCCGTCC 
TTCAAGAAGA AGGGCAGGAC CCTCGACTCG GCGACCTACT TCCGGAACTG CTTCAGTTTC 
CGCGACGGGC AGGTCAGGCT GGCGAAACAG GATCTGCCGT TGGACATCGC CTGGTCGCGT 
CCGCTGCCCG AGGGTGCGGC GCCGTCCCAG GTGACGGTGT CGCGTAACAC CCGCGGCCAG 
TACCACATCT CGATCCTGGT CGAGGAGACC ATCAGCAGCC TGCCTCCGTC GCCGGCACAG 
GTGGGGGTCG ATGCGGGTGT CACGTCCCTG GTTGCCTTGT CGACGGGCGA GAAGGTGACC 
AACCCGTGGC ACGAGCGGGC TGACCGTGCC CGGCTCGCCC GCGCGCAGCG GGAACTGTCC 
CGTAAACGGA AGGGTTCGGC GAACCGGGCC AGGTCCCGGC TCACCGTGGC GCGTATCCAC 
GGGCGGATCG CCGACCGGCG CCGGGATCAT CTGCACAAGC TGTCCACGAG GATCATCCGC 
GAGAACCAAA CGGTGGTCAT CGAGGACCTG GCGGTCCGCA CCATGGTCCG TAACCATTCG 
CTGGCACAGG CGATTTCCGA CGCTTCCTGG TCGGAGCTAC GGCGGATGTT GGAGTACAAG 
GCCGACTGGT ATGGCCGCAC GGTGATCGCG GTCGACCGTT TCTACCCGAG CAGCAGGACC 
TGCTCGGCCT GTGGGTCGAT CGTCGAGAAG CTGCCGTTGA ACGTACGGGA GTGGGAGTGC 
CGCTGCGGCG CGCACCACGA CCGGGATGTC AACGCTGCGA AGAACATTCT GGCCGCGGGG 
CTCGCGGTGT CTGCCTGTGG AGACGGAGTG AGACCACCTC GCTCCTAG

Protein sequence

MKRAYRYRFY PTVEQAEQLA RTFGCVRYVY NRALAERHRV WFQEQRRVTH AETDKMLTAW 
KRDPETAWLA EPSKGPLQAT LRHLQTAYVN FWEKRAGYPS FKKKGRTLDS ATYFRNCFSF 
RDGQVRLAKQ DLPLDIAWSR PLPEGAAPSQ VTVSRNTRGQ YHISILVEET ISSLPPSPAQ 
VGVDAGVTSL VALSTGEKVT NPWHERADRA RLARAQRELS RKRKGSANRA RSRLTVARIH 
GRIADRRRDH LHKLSTRIIR ENQTVVIEDL AVRTMVRNHS LAQAISDASW SELRRMLEYK 
ADWYGRTVIA VDRFYPSSRT CSACGSIVEK LPLNVREWEC RCGAHHDRDV NAAKNILAAG 
LAVSACGDGV RPPRS