Gene Franean1_1851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1851
Symbol
ID	5670253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2222811
End bp	2223965
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	70%
IMG OID	641240772
Product	IS605 family transposase OrfB
Protein accession	YP_001506195
Protein GI	158313687
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0177268
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTCAACG ACGCGATCCG GGCCCGCGAC GAGGCGTACA AGGCCGGCGA GAAACTGTCG 
GACACCGAGG TTCAGCGCCG GGTGGTCACC CTCGCGAAAC TCACCGACGA GCGAACCTGG 
CTGTCCGAGG TGTCGTCGGT GGTACTCGTG CAGGCGTGCC AGGACGCACG CCGGGCGTTC 
CGGAACTGGT TCGACTCGCT GTCCGGGAAG CGGAAAGGCC GGCAGGTCGG CCATCCGCGG 
TTCCGGTCAC GGAAGGACAA CCGGCAGTCG ATCCGCCTCA CCCGCAACGG CTTCACCGTC 
ACGCCCCGAG GGGTGCGGGT GGCGAAGGTC GGAGATCTGC GGCTGGCCTG GTCGCGTCCG 
CTGCCCTCGG TTCCGACGTC GGCGACGGTG ATCCGGGAGG CGGACGGCAG GTACTACGTG 
TCGTTCGTCG TCGACGTCGA CGACGTCCCC TCCCCGGCGA CAGGCGCCGA GATCGGCGTC 
GACCTCGGGT TGGACCGGCT CGCGACCCTG TCAACCGGAC AGATCGTCGC GAACCCGCGT 
CCTCTGCGGT CGCGTCAGCG CAGGCTCGCC CGCGCACAGC GGGCACTGGC CCGCAAGCGG 
AAGGGTTCGG TGAACCGGCG CAAGGCGGTC CGCCGGGTCG CGGTCGAACA TCGGAAGGTA 
CGGGACACCC GCCGGGATCA TCATCACAAG CTCGCTGCTC GGCTGGTCCG CGACAACCAA 
GCGGTCTACG TCGAGGATCT GGCGGTAGCC GGGCTGGCTC GTACGCGGCT GGCCCGGTCG 
GTGCACGACG CGGGCTGGTC GATGCTGGTC GGTCTGCTCG AGGAGAAAGC GGCCCGGTGT 
GGCCGGGCCG TGGTGAGGGT GGGCCGGTTC TTCCCGTCGT CGCAGGTCTG CTCGGCCTGC 
GGCCACCGGG ACGGCCCGAA GCCTCTCCAG GTCCGGACGT GGACCTGTCC GGGGTGCGGT 
GTCAGCCACG ACCGGGACCT GAATGCCGCG CGGAACATCC TCGTCGAGGG TCAGCGCCTG 
GTCGCCGCCG GGCGGAAAGG CGTGGCTGCA ATGCCACGTC AGGCGGAGAC CGTAAACGCC 
TGCGGAGCCG ACGTGAGACC CGGACCCCTC CGGGCAGCTG GCTGTGAAAC AGGAACCCAC 
CGAGGTGCCG CGTGA

Protein sequence

MFNDAIRARD EAYKAGEKLS DTEVQRRVVT LAKLTDERTW LSEVSSVVLV QACQDARRAF 
RNWFDSLSGK RKGRQVGHPR FRSRKDNRQS IRLTRNGFTV TPRGVRVAKV GDLRLAWSRP 
LPSVPTSATV IREADGRYYV SFVVDVDDVP SPATGAEIGV DLGLDRLATL STGQIVANPR 
PLRSRQRRLA RAQRALARKR KGSVNRRKAV RRVAVEHRKV RDTRRDHHHK LAARLVRDNQ 
AVYVEDLAVA GLARTRLARS VHDAGWSMLV GLLEEKAARC GRAVVRVGRF FPSSQVCSAC 
GHRDGPKPLQ VRTWTCPGCG VSHDRDLNAA RNILVEGQRL VAAGRKGVAA MPRQAETVNA 
CGADVRPGPL RAAGCETGTH RGAA