Gene Franean1_5918 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5918
Symbol
ID	5674239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7189343
End bp	7190542
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	71%
IMG OID	641244766
Product	IS605 family transposase OrfB
Protein accession	YP_001510168
Protein GI	158317660
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.320804
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGACGTT CCTTCAGGTT CCAGCTTCGC CCGACCGCCC GGCAGGCCGC GGCGCTGAGC 
GTGATGCTCG GCGACCACCG GGCGCTGTAC AACGCCGCGT TGCAGGAACG CCGCGACGCC 
TGGCGTCACC CGTCGAAGAC CACGATCCGC TACGGCGACC AGTCCGCCCA GTTGAAGGAG 
ATCCGCGCCT GTGACCCGGA CCAGGGCCGC TGGTCGTTCT CCTCTCAGCA GGCCACCCTG 
CGCCGGCTCG ACAAGGCGAT GGCCGCGTTC TTCCGCCGGG TCAGGGCGGG CGCGACGCCC 
GGCTACCCGC GGTTCAAGGG CGCGGGCCGG TTCGACACGG TGGAGTGGCC GAAGGACGGT 
GATGGTTGCC GCTGGGACTC CCAGCCCGGG CATCCCGCCC AGACCCGGGT CCGACTGCAG 
GGCATCGGAC ATGTCAGGGT CAACCAGCAT CGGCCCGTGG CCGGCACGGT CAAGACGATC 
AGCCTGAAGC GGGAAGGCCG CCGCTGGTAT GTGCTGTTGT CCTGCGACGA CGTGCCCGCT 
GAGCCCTTCC CGGCCACCGG GGTGGTGGTC GGGGCGGACC TGGGTGTGGC GTCGCTGGTC 
ACCCTCTCCG ACGGCCGCCA CGTCGGGAAC CCCCGCTACC TCGCGGCGGC GGCCGGCCGG 
CTCGCGCGGG CGCAGCGGGA ACTGGCCCGC AAGAAGCGTG GGTCCACCCG GCGCCGGAAG 
GCGGTCGCCA CGGTCGCGGC GCTGCACGGC ACGGTGCGCC GCCAGCGACT CGATCTCGCC 
CACAAGGCGG CCCTCAGGCT GGTCCGTGAG CATGATCTGA TCGCCGTCGA GGCGCTGAAG 
GTCACCAACA TGACCCGCAG GGCCGAACCG AAGCCCGACC CTGACCAGTC GGGGGCGTTC 
CTCCCGAACG GTCAGGCCGC CAAATCCGGG CTGAACAAGT CGATCCTTGA CGCGGGATGG 
GGGGTGTTCC TCGCCGTGCT GCGCGCCAAG GCTGAAAGTG CCGGACGGGT GGTCGTCGAG 
GTCAACCCCG CCCACACCTC CCGCACCTGC GCGGCGTGCG GGCACTGCCA CGCCGACAAC 
CGCAGAACAC AGGCCGCGTT CACCTGTGTC GCCTGCGGAC ACGCCGCGCA CGCCGACGTG 
AACGCGGCGG TCAACATTCT TCGGGTCGGG CTGGCCCGTC AGGCCGCGGA AGCGGCCTGA

Protein sequence

MRRSFRFQLR PTARQAAALS VMLGDHRALY NAALQERRDA WRHPSKTTIR YGDQSAQLKE 
IRACDPDQGR WSFSSQQATL RRLDKAMAAF FRRVRAGATP GYPRFKGAGR FDTVEWPKDG 
DGCRWDSQPG HPAQTRVRLQ GIGHVRVNQH RPVAGTVKTI SLKREGRRWY VLLSCDDVPA 
EPFPATGVVV GADLGVASLV TLSDGRHVGN PRYLAAAAGR LARAQRELAR KKRGSTRRRK 
AVATVAALHG TVRRQRLDLA HKAALRLVRE HDLIAVEALK VTNMTRRAEP KPDPDQSGAF 
LPNGQAAKSG LNKSILDAGW GVFLAVLRAK AESAGRVVVE VNPAHTSRTC AACGHCHADN 
RRTQAAFTCV ACGHAAHADV NAAVNILRVG LARQAAEAA