Gene Franean1_1554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1554
Symbol
ID	5669957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1860955
End bp	1862088
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	67%
IMG OID	641240473
Product	IS605 family transposase OrfB
Protein accession	YP_001505899
Protein GI	158313391
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.596284
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTGAAGC GGGCGTACCG CTACCGCTTC AACCCGACCC CCGATCAGGC CGCCCAGCTC 
GCGCGAACCT TCGGCTGTGT CCGCTACGTG TACAACCGGG CGCTCGCCGA ACGGCACCGG 
GCCTGGTTCC AGGAGCAGCG GCGGGTCACC CACGCCGAGA CCGACCGGAT GCTCACGGCG 
TGGAAGCGCG ACCCGGAAAC GGAATGGCTC GCCGAGCCGT CGAAAGGCCC GCTTCAGGCC 
ACGCTGCGGA ATCTCCAGAC CTCGTATGTG AACTTCTGGC AGAAACGCGC CGGCTACCCG 
ACGTTCAAGA AGAAGGGCAG GACTCTCGAC TCGGCGACCT ACTTCCGGAA CTGTTTCAGT 
TTTCGGGACG GTCGGATCAC GCTGGCGAAG CAGGACGGGC CGCTGGCGAT CGTCTGGTCG 
CGTCCGCTGC CCGAGGGCGC GGAGCCCTCG CAGGTCACGG TGTCGCGGAA CGCCCGCGGC 
CAGTACCACA TCTCGATCCT GGTCGAAGAG ACGATCACTA CGCTTCCCGC GTTGCCCGGG 
CGGGTGGGGA TCGACGCGGG GGTCGCCTCG CTGGTCACCC TGTCGACGGG GGAGAAGGTG 
GCCAACCCGA AGCACGAGCG TCGGGACCGG GCCCGGCTGG CCCGTGCGCA GCGGGACCTG 
TCCCGGAAGG TGCAGGGGTC GGCGAACCGG GCGAAGGCCC GAGCGAGGGT CGCCCGGGTG 
CACGGTCGGA TCGCCGACCG GCGTCGGGAT CATCTCCACG CGCTGTCCAC GAGGATCATC 
CGCGAGAACC AAACGGTGGT CATCGAGGAT CTGTCCGTCC GCAACATGGT CAGGAACCAT 
TCGCTCGCGC GGGCGATATC CGATGCTTCG TGGTCGGAGT TGCGGCGGAT GTTGGAGTAC 
AAGGCCGGCT GGTACGGTCG CACCCTCATT GCGATCGATC GGTTCTATCC GTCGTCCAAA 
ACCTGTTCGG TGTGCGGGTC GATCGTGAAG GAACTGCCGC TCAACGTCCG GGAATGGGCC 
TGCCGTGGTT GCGGCACGGT CCACGACCGG GACGTGAACG CGGCGGTCAA CATTCTGGCC 
GCGGGGCTCG CGGTGGCTGC CTGTGGAGAT GGAGTGAGAC CGCCTCGCTC CTGA

Protein sequence

MVKRAYRYRF NPTPDQAAQL ARTFGCVRYV YNRALAERHR AWFQEQRRVT HAETDRMLTA 
WKRDPETEWL AEPSKGPLQA TLRNLQTSYV NFWQKRAGYP TFKKKGRTLD SATYFRNCFS 
FRDGRITLAK QDGPLAIVWS RPLPEGAEPS QVTVSRNARG QYHISILVEE TITTLPALPG 
RVGIDAGVAS LVTLSTGEKV ANPKHERRDR ARLARAQRDL SRKVQGSANR AKARARVARV 
HGRIADRRRD HLHALSTRII RENQTVVIED LSVRNMVRNH SLARAISDAS WSELRRMLEY 
KAGWYGRTLI AIDRFYPSSK TCSVCGSIVK ELPLNVREWA CRGCGTVHDR DVNAAVNILA 
AGLAVAACGD GVRPPRS