Gene Francci3_1108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1108
Symbol
ID	3905450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1322974
End bp	1324188
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	72%
IMG OID	637878440
Product	transposase, IS4
Protein accession	YP_480217
Protein GI	86739817
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.280026
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.277743
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGTGG GCGCATTGTC CCGTGCCGCG GCCGTGGTGG TGGGAGCCGG GGCCGTGTCG 
CGTGCGGGGA TCTGGGAACG GTTGGCGGCG ATACCGGATC ATCGGTCCGC CCGAGGGCTG 
GTCTATCCGC TTCCGGTGCT GGCAGCGGTC TGGTTGTGCG CGGTGACCGC GGCCGGGCAT 
GACCGGGTCG CGGCGGTGAC CGAGTGGCTG GCGGCGACGA GCTGGACGGA ACGAGTCCGG 
TTACGGCTGC CGTGGAATCC GTGGGACGGG CACCTGCTGC CGGACGAGGC CACGATCCGC 
CGGTTCCTCA ACACCGTCGA TGACCAGGCG CTCGCCACCG CGTTGCTTGA TCCGCCGCTG 
GCCGACACCC CGGCTGACCT CACCGATGCG GTCCCGTCCG CCCCGGTTCG TCCGCCTGCC 
GGGGACCAGG CGGTGCCAGT GCGGGCGTAT GCGGTGGACG GGAAGACCAG CCGAGGCGCG 
AAACGCGCGG ACGGGAGCCA GGTCCACCTG CTCGGGGTCG CCGCCCACGG CGCCGGGGCG 
CTCCTCGGCC AGCGGGAGAT CGACGCGAAA AGCAACGAGA CCACCGAGTT CCGTGCGCTG 
CTGGCACCCC TGGAGCTGGC CGGGGCGTTC GTGTCGTTCG ATGCCCTGCA CACGGTGCGG 
TCCAACCTCG ACTGGCTCGT CGTCCGGAAG AACGCCCACT ACCTGGCGGT CGCGAAACAC 
AACCAGCCGA AGCTACGGGC GTTCCTGGCC GCGTTGCCGT GGACGGAGAT CCCGACCGCG 
GACCTCACCC GCGACCGGGG TCATGGCCGG GAGGAGACCC GCACCCTGAA GGTCGCCACC 
GTCACCCACC TCGACTTCCC ACACGCGGCC CAGGCCATCC GGATCAGACG CTGGCGCCGG 
CAGAAAGGCC AGCCAGCCAG CCACGAGACG ATCTACGCGA TCACTGATGC GACCGCGGAC 
CAGGCCAGCC CCGCGCTGCT GGCCGATCTC GCCCGCGGCC AGTGGCACAT CGAGGTCAAA 
CAGCACTACG TCCGCGACGT GACCTTCGGG GAGGACTCCA GCACCAGCCG GACCGGCCGC 
GGTCCCGCCG TCCTCGCGCT GTTCCGGGCC ACCGTCGCCG ATACCCTGCG TCGCGCCGGT 
CATCGCAGCG TTCCCGCCTG CCGCCGCGCC CACAAGACCG CCACCGCCGC CCTCGACCTT 
CACGGCTTCC CCTGA

Protein sequence

MSVGALSRAA AVVVGAGAVS RAGIWERLAA IPDHRSARGL VYPLPVLAAV WLCAVTAAGH 
DRVAAVTEWL AATSWTERVR LRLPWNPWDG HLLPDEATIR RFLNTVDDQA LATALLDPPL 
ADTPADLTDA VPSAPVRPPA GDQAVPVRAY AVDGKTSRGA KRADGSQVHL LGVAAHGAGA 
LLGQREIDAK SNETTEFRAL LAPLELAGAF VSFDALHTVR SNLDWLVVRK NAHYLAVAKH 
NQPKLRAFLA ALPWTEIPTA DLTRDRGHGR EETRTLKVAT VTHLDFPHAA QAIRIRRWRR 
QKGQPASHET IYAITDATAD QASPALLADL ARGQWHIEVK QHYVRDVTFG EDSSTSRTGR 
GPAVLALFRA TVADTLRRAG HRSVPACRRA HKTATAALDL HGFP