Gene Francci3_3189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3189
Symbol
ID	3903915
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3778339
End bp	3779814
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	77%
IMG OID	637880513
Product	putative RNA-binding Sun protein
Protein accession	YP_482275
Protein GI	86741875
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00563] ribosomal RNA small subunit methyltransferase RsmB

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000532749
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.349925
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGATCGG CCGGTTCGCC GGGCACCCGT GGGCCCCGGC CAGCGTCAAG CGTCGACCGG 
CCGCGGTTGC TGGCCTGGGA GGTGCTGCGG GCGGTGGACG AGCGCGGCTC CTACGCCAAC 
CTGCTGCTGC CGTCCCTGTT GGCGGGCAGC GGGCTGTCCG CCCGGGACCG CGGGTTCGTC 
ACGGAGCTCG CCTACGGCTC CCTGCGTGCG CAGGGCACCC TCGACGGGGT GCTCGACACG 
GCGACGAGTC GACCCGTCCA CACCATCGAC CCGCCGGTGC GCGACGCGCT GCGCCTGGGC 
GCCTACCAGC TGCTGCGGAC CAGGGTCCCG GCCCACGCGG CCGTGGCCAG CACCGTCGAG 
CTGGTCCGCA CGACGAGTGG CGAGCGCCCG GTCCGCTTCG CGAACGCCGT GCTGCGTCGG 
GTGGCCGCCC GGGTGGCCGA GACCGGCGGC GATCTCGCCA CGATGCTGTC CGCACCGCGG 
TTCGACGTCG ACCCTGTCGG TCACCTGGCG GTCGTGACGA CGCATCCCCG CTGGATCGTC 
GAGGTCGTCG CGGAGGCCCT GGCCGGCGAC CTCACGGCGA CCCGCGCCGC GCTGGAGGCA 
GACGACGTCC GACCCGCGGT ACACCTGGTC GCCCGTCCGG GCCGGGTCGA CCGTGACCGG 
CTGCTCGCCG AGGCCGCGCA GGCAGGTCTG ACCGCCCGAG TCGGCCCCTA CTCGCCGTAT 
GCGGTACGCC TCGACGGCGG GGACCCGGCG GGGTTGCCCG CCGTGGCCGC GGGCGCGGCC 
GCCGTGCAGG ACGAGGGCAG CCAGCTCGTC ACCCTGGCCC TGGCCCGCGC GGCGACGGTG 
GGCCGTGACC TCGGGCTGAC CGTCGACCTG TGCGCGGGCC CCGGCGGGAA GGCGGCCCTG 
CTCGCCGCGC TGCTCGGCGG CTCCGCCCCA TCGGACGGGC CGGGTCTGCC GGACAGGCCG 
GGTCCACCGG ACAGGCCGGC CCTGATCGCG GTCGAGCCCC GGGCGACCCG GGCGGCCATG 
GTGGCCCGGT CCCTGGGCGA CGCGGCGCGG GCCTGGACGG TGCGCGCCGA CGGCCGGGCG 
GTGCCGCTGC GGCCCGATGG AGCCGACCGG GTGCTGGTCG ACGTCCCCTG CACCGGCCTC 
GGAGCACTGC GGCGCCGGCC GGAGGCCCGG TGGCGGCGGA CCTCGGCCGA TGTGGCCGCG 
CTCGTCCCGC TCCAGCGTGC GCTGCTCGTC GCCGCGCTCG ACCTGGTCCG CCCGGGCGGG 
GTGGTGGCGT ACGCGACCTG TTCCCCGCAC CCGGCCGAGA CCGTCGAGGT GGTGCGTGGC 
GTGGCCGGAC AACGCGCCGA CACCTCCATC CTCGATGCCC GCCTGACCCT GCCGGAGGTC 
GACCGGCTCG GTGACGGCCC GTTCGTCCAG CTCTGGCCGC ATCTCCATGG CACGGATGCG 
ATGTTCGTCG CCCTGCTGCG CCGGGTCGAC AGCTGA

Protein sequence

MRSAGSPGTR GPRPASSVDR PRLLAWEVLR AVDERGSYAN LLLPSLLAGS GLSARDRGFV 
TELAYGSLRA QGTLDGVLDT ATSRPVHTID PPVRDALRLG AYQLLRTRVP AHAAVASTVE 
LVRTTSGERP VRFANAVLRR VAARVAETGG DLATMLSAPR FDVDPVGHLA VVTTHPRWIV 
EVVAEALAGD LTATRAALEA DDVRPAVHLV ARPGRVDRDR LLAEAAQAGL TARVGPYSPY 
AVRLDGGDPA GLPAVAAGAA AVQDEGSQLV TLALARAATV GRDLGLTVDL CAGPGGKAAL 
LAALLGGSAP SDGPGLPDRP GPPDRPALIA VEPRATRAAM VARSLGDAAR AWTVRADGRA 
VPLRPDGADR VLVDVPCTGL GALRRRPEAR WRRTSADVAA LVPLQRALLV AALDLVRPGG 
VVAYATCSPH PAETVEVVRG VAGQRADTSI LDARLTLPEV DRLGDGPFVQ LWPHLHGTDA 
MFVALLRRVD S