Gene Francci3_1119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1119
Symbol
ID	3905461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1332065
End bp	1333237
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	72%
IMG OID	637878451
Product	transposase, IS4
Protein accession	YP_480228
Protein GI	86739828
COG category	[L] Replication, recombination and repair
COG ID	[COG5433] Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCCG CACCAGTATT ACCGCCTGCC CCTGTTCTCG ATCGGCTGGC TGCCGTCGGC 
GCCGGCAACC AGCCTCCGTC GCCGGCGGGT CTGCTGGCGG TCTTCAACCA GCTACCGGAC 
CCCCGGAAGC CCCGCGGCAG GCGGCACAGC CTGGCCGCTG TGCTGACGCT GGCGACCTGC 
GCGGTGCTCG CCGGGGCGCG GTCGTTCACC GCGATCGGTG AATGGTCCGC CGACGCCGGC 
CAGGCGGTCG CGGGCCTGCT CGGCGTCTCT CGAGTGCCCG AGGAGTCGAC GTTTCGCCGG 
GTACTCGCCG CACTCGACGC CGACGCCCTG GATACGGCGC TGGGAGCATG GGCCGCCGCG 
GCGACCACCC CGCCGGCCGG GACGCGGCGG CGGCTCGCGG TCGACGGCAA GACGCTGCGC 
GGCTCCCGCA CGCCTGACAG TCCGGGCCGC CACCTGCTCG CCGCGCTCGA CCACACCAGC 
GGTGTCGTGC TCGGCCAGGT CGCCGTCGAC GCGAAGTCGA ACGAGATCCC GGCGCTGCCC 
GTCCTGCTCG CCGACCTGGA CCTGACCGAT GTGATCGTGA CCGCGGATGC TCTACACACC 
CAGCGACAGA CCGCATCCTG GCTGGTCAGC CGGCATGCGC ACTACATCCT GACGGTGAAG 
GCCAACCAGC CGGCGCTATA CGCCCAGCTC GCCGCCCTGC CCTGGCGCCG GGTGAAGACC 
GCCGCGCGCA CCGTCGAACG CGGCCACGGC CGCCGCGAGC GGCGCACCGT GAAGACCACC 
GAGGTCCGCG CGGGACTACT CTTCCCGCAC GCCGTGCAGG CAGTGCAGGT CACCCGCCGC 
CGCCAGCCGC TCGCCGACGG GCCGGCCACG ACCGAGATCG TCTACCTTGT CACCAGCCTG 
CCGACCCACC AGGCCAGCCC CACGCTGCTG GCCACCTACG CCCGCGAGCA CTGGCTCGTG 
GAGAACCGGC TGCACTGGGT CCGCGACGTC ACCTTCGGGG AGGACCTCAG CCAGGTCCGG 
ACCGGCCACG CTCCCCAGGT CATGGCCAGC CTGCGCAACC TGGCGATCGC GATCCTTCGC 
CTGACCGGCG CCACGAACAT CGCCCAGGCA ATCCGACACC ACGCGCGGCG CCCCGAACGA 
CCACTAGAGA CGATCAAGAG CCTTGCTTGC TAA

Protein sequence

MPAAPVLPPA PVLDRLAAVG AGNQPPSPAG LLAVFNQLPD PRKPRGRRHS LAAVLTLATC 
AVLAGARSFT AIGEWSADAG QAVAGLLGVS RVPEESTFRR VLAALDADAL DTALGAWAAA 
ATTPPAGTRR RLAVDGKTLR GSRTPDSPGR HLLAALDHTS GVVLGQVAVD AKSNEIPALP 
VLLADLDLTD VIVTADALHT QRQTASWLVS RHAHYILTVK ANQPALYAQL AALPWRRVKT 
AARTVERGHG RRERRTVKTT EVRAGLLFPH AVQAVQVTRR RQPLADGPAT TEIVYLVTSL 
PTHQASPTLL ATYAREHWLV ENRLHWVRDV TFGEDLSQVR TGHAPQVMAS LRNLAIAILR 
LTGATNIAQA IRHHARRPER PLETIKSLAC