Gene Francci3_4145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4145
Symbol
ID	3907110
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4945748
End bp	4947202
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	73%
IMG OID	637881473
Product	transposase IS66
Protein accession	YP_483222
Protein GI	86742822
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTCTGC TTGCGGACCG GGACGCCACC ATCGCCGCCC AGGCGGCCAC GATCGCGGAG 
CAGGCGCGGC TGGTCGAGCG GCTGGTCGGG CAGGTGGAGC AGCTCACCGA CAGGGTCCGC 
GAACTGGACC GCCAACTCGG CAGGGACAGT ACGAACTCGT CGTGGCCGTC GTCGTCGGAC 
AGCCCGTATA CGAAGAAGAA GGCCAAGCCC CGGTCGTCGC GGACGTCGAT GGGCCGGCCG 
AGGGGTAAGC AGCCCGGCGC GACGGGCGCG ACCCGTCAGA TGGTCGACGA CCCGGACGAG 
ATCCACACGA TCGACCCGTC GTTATGCGCG GACTGCGGGT TCCCGCTGGC CGGAGCGGCG 
AGGCTCACGA CGCGGCGCCA CCAGATCTTC GACCCGCCGC CCCCGCCGCG CCCGTATGTC 
ATCGAGTACC GGATCGTGAC GCGGGTCTGT CCGTGCTGCG CGGCGACGAC CGAGGGGCTG 
ACACCCGTCC CGCTGGCGGG CCGGCTTGTC TGGGGCCCGC GGATGCTCGC GCGAGCGGTG 
TGGCTCGTGT GCGCGCACCA CCTCCCGATC CGCCGCGCCG CGGCGGTCCT GACGGTGATG 
GTCGGCGCGA CGGTCTCCGC CGGCTGGGCC GGCGGCGTGC GAGCCCGCGC CGCGCGTCTG 
TTGGAGAACA CCTTCCTCCC GCACGTGCGG GCGTTGATCG CCGCCGCGCC GGTCGCGCAC 
GCCGACGAGA CGACCGCCCG CGCCGACGGC GCGCTGCGCT ACGTCCACGT CGCCGCCACC 
GACTACCTGA CCGCGCTGCA CACCGGTGAC CGGACCGCCG AGACGATCGA CGCCGGCGGG 
ATCTGGCCGG CGTTCACCGG CGTGCTGATG CGGGACGGCT ACCAGGGCTA CACCCACCTC 
ACCCGGGCGC TGCACGCCTG GTGCGGCGCG CACACCCTGC GCGACCTGCG GTCCATCCAT 
GACGGCGACC GTGGCGGGCA GGTCTGGGCC GACGCGATGG CGACCACCCT GCTCGACGCC 
CACCACGCCG CGTGCGACGC CCGCGACGCC GGGGCGAACG CGCTCGCGCC CGAGGCCGTC 
GCCCTCATCC GCAACCACTA CCGCGGCGCG CTCGCCCGCG GCGAGACCGA CAACCACGGG 
GACCGCTCGT CACTCGCCCA CGACGCTCGC ACACTGATCC GCCGGATGCG CCGCGAGGAG 
GACATGATCC TCCGCTTCGT CGTCGACCTG ACCGTGCCCT TCTCGAACAA TCAAGCAGAA 
AGGGACGTCA GGCCGGTCAA GGTCCAGCAA CGCACCTCCG GTGGTTGCTG GCGGACCCTG 
GCCGGCCTCG TCGACTTCGC GGTCGTGCAG TCCTACCTGT CGACCGCGAC CAAGTGGGGC 
CTCGACACCC TCGACGTTCT CGAACGACTC TTCACGACCG GCCCCTGGCT ACCGCCCGCC 
GCTGAACCCG GCTGA

Protein sequence

MRLLADRDAT IAAQAATIAE QARLVERLVG QVEQLTDRVR ELDRQLGRDS TNSSWPSSSD 
SPYTKKKAKP RSSRTSMGRP RGKQPGATGA TRQMVDDPDE IHTIDPSLCA DCGFPLAGAA 
RLTTRRHQIF DPPPPPRPYV IEYRIVTRVC PCCAATTEGL TPVPLAGRLV WGPRMLARAV 
WLVCAHHLPI RRAAAVLTVM VGATVSAGWA GGVRARAARL LENTFLPHVR ALIAAAPVAH 
ADETTARADG ALRYVHVAAT DYLTALHTGD RTAETIDAGG IWPAFTGVLM RDGYQGYTHL 
TRALHAWCGA HTLRDLRSIH DGDRGGQVWA DAMATTLLDA HHAACDARDA GANALAPEAV 
ALIRNHYRGA LARGETDNHG DRSSLAHDAR TLIRRMRREE DMILRFVVDL TVPFSNNQAE 
RDVRPVKVQQ RTSGGCWRTL AGLVDFAVVQ SYLSTATKWG LDTLDVLERL FTTGPWLPPA 
AEPG