Gene Francci3_1089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1089
Symbol
ID	3905760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1301636
End bp	1302808
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	72%
IMG OID	637878422
Product	transposase, IS4
Protein accession	YP_480199
Protein GI	86739799
COG category	[L] Replication, recombination and repair
COG ID	[COG5659] FOG: Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCG CTATCGGGCG CTCTTATGCA ACGGCTGCTG ACCGACGGCA AGCGCAAGAG 
CATGGTCCCG ATGGCCGCCC GCCTCGGGGT GGACCCTCAG CAGCTGCAGC AGTTCGTCAC 
CAGCTCGACC TGGGACTACC GCCAGGTCCG GCGGCGGCTG ACGGGCTGGG CGGCCGGGTT 
CTGCGACCCG GTCGCGCTGG TCGTGGACGA CACCGGCTTT CCCAAGGACG GGCCGCCTCC 
CCCGGGGTGG CCCGGATGTA CTCCGGCACC CTGGGCAAGG TCGGGAACTG TCAGATCGGG 
GTGTCCGTGC ACGCGGTCAC CGACTGGGCG TCAGCCGCGG TGGCCTGGCG GCTGTTCCTC 
CCGACCTGCT GGGACGACAC CACCCTGACC GACCCGACCG AGGTCGCCGC CGCCCGGGCC 
CGGCGGGAAC GGGCCGCGAT CCCCGACAAG GCGCGGCACC GGGAGAAATG GCGGCTCGCC 
CTGGACATGA TCGACGAACT GGCCGGCTGG GGCATGCCTG TGCGGCCGGT CGTGGCGGAC 
GCCGGCTACG GCGACGCCGC TGCCTTCCGC CAGGGGCTGA CCGACCGGAA CATCCCCTAC 
GTGCTGGCGG TGAAGCCGAC CGCGACCGCC TACCCGGCCG ACGCGGTGCC GGTCACCGCC 
CCCTACCCGG GAAACAGCCG GCGGCCCACA CCCGCCTACC CCGACCCGCC CCGCGATCTG 
AAATCCCTGG TCATGGCCGC CGGCCGCCGC GCCGGCCGGT CTGTGACCTG GCGTCACGGC 
ACCCACCGGA CCCCGGCCAA CCCGACCGCG GGGATGCGGT CCCGCTTCCT CGCGCTCCGG 
GTCCGCCCCG CGGGCCGGAA CATCACCCGT AACCCCGACC GGAGCCTGCC CGTCTGCTGG 
CTGCTCGCCG AATGGCCAGT CGGCCAGCCC GAACCCACCG ATTACTGGCT GTCCACCCTG 
CCCACCGGCA TCCCCCTGCG CGATCTTGTC CGTCTCGCGA AGATCCGCTG GCGGATCGAA 
CACGACTACC GCGAGTTGAA AGACGGCCTC GGCCTCGACC ACTTCGAGGG CCGAACCTTC 
GCCGGCTGGC ACCGTCACGT CACCCTCGTC AGGGTCGCCC AAGCCCTCTG CACCCAGCTG 
AGACGAACCC CAAAAGTCCC TGCGCCGGCC TGA

Protein sequence

MSAAIGRSYA TAADRRQAQE HGPDGRPPRG GPSAAAAVRH QLDLGLPPGP AAADGLGGRV 
LRPGRAGRGR HRLSQGRAAS PGVARMYSGT LGKVGNCQIG VSVHAVTDWA SAAVAWRLFL 
PTCWDDTTLT DPTEVAAARA RRERAAIPDK ARHREKWRLA LDMIDELAGW GMPVRPVVAD 
AGYGDAAAFR QGLTDRNIPY VLAVKPTATA YPADAVPVTA PYPGNSRRPT PAYPDPPRDL 
KSLVMAAGRR AGRSVTWRHG THRTPANPTA GMRSRFLALR VRPAGRNITR NPDRSLPVCW 
LLAEWPVGQP EPTDYWLSTL PTGIPLRDLV RLAKIRWRIE HDYRELKDGL GLDHFEGRTF 
AGWHRHVTLV RVAQALCTQL RRTPKVPAPA