Gene Francci3_3028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3028
Symbol
ID	3904381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3593749
End bp	3595581
Gene Length	1833 bp
Protein Length	610 aa
Translation table	11
GC content	73%
IMG OID	637880348
Product	methyltransferases-like
Protein accession	YP_482114
Protein GI	86741714
COG category	[R] General function prediction only
COG ID	[COG1568] Predicted methyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.274424
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCCCTC CACATACCCT GTCAGGACCG GATCACCCGG GCCGGGCGCC GGGTCCGGCC 
GAATCCGGCG AGTCGTTGGC GACCCTGCTG GCGGGCTACC GGGTGCATGC CCGGGCGCCT 
CGCGCGGCGG TGGCGGCGCT GACCGAGCAG CCACGCACCC TGCGCCAGCT GGTCCAGAGT 
TCGGGCCTGC CCCGACGGAG CGTGGAGGAG ATCCTCGCCA GCCTCGGCGA CGATCTGCGG 
ACCGGCCCCG ACGGGCGTCA CGTGCTGCGC CCCGCGTCGA TCGACCGCTA CCGCGGCCTG 
ATCCGCTATG ACGAGCTGAG CGGACAGACT CCGCTCGATC CCCTCGCCGC CGTGATCACC 
CGCCACGGTC CGCTGGTCAC GACCATGCAT GATCTCATCG CTGCCGCGCC CCGACCGCGG 
GCCGACCTCG ACCACGTACC CGCGACGGCG ACGACCGTCG TGCGCCGGGC CGTCTGGCTG 
CGGACGCGTT ACGACCTGCG CGGCGCGCAT CTGCTGTGCA TAGGTGATCA TGATCTCACC 
TCGCTGGCGG CGGTCTCGTT GATCGACGGG CTCACCGTGA CCGTCGTCGA CATCGACGAC 
GAGCTGCTCG CCTACCTGGA CAGCTCGGCC CGGTCGTTGG ACGTCCGGCT GCGGTGCCTC 
TACGCCGACC TGCGCTTCGG CCTGCCGCCG GCGGTGGTGG GCACAGCCGA TCTGGCATTC 
ACCGATCCGC CCTACACCCC GGAGGGCGTG GCGCTGTTCA CCGGGCGCGG CGCGCAGGGT 
CTCGCGGACC GCGAACATGG TCGCGTCCTG CTGGCCTACG GGTTCAGCGA CCGGGTACCG 
ACGCTGGGTT GGAAGGTGCA GCGGGCACTG ATCGATCAGG GCTTCGTGTT CGAGGCCATC 
TGGCCAGGCT TCCACGTCTA CGAGGGCGCG GAGGCGGTGG GCGCCAGAGC CGACATGTAC 
GTCTGCCAGC CGACCCCGGC CACCTGGAAG CAGCTGGACC GCTCGGCCAC GGCGGCCACA 
ACCGCGACGG CCGCCATCTA CACCCGGGGC CGGCAGTCCA CGCAGAGTCG GCCGACGCGC 
CTGACCGCCC CGGTCCTCGA CGCGGTGGCC GCCTTCCTCG CCACCGGCCC GGCGGGTCGC 
GCCGTGTTCG TTGGCGAGCG GCGGGAGGTC GACGCGGTCC ACGTGCGTCT CGCGACCGTG 
TTCGACCGGG GGCTGCCCGC GTTCGCCTCG ACCGGCCCCG GCTCCTCGAC CGGCCCCGGC 
GCCTCAACCG AGGACGGAAC GGTCAGCGTG GCCACCGACC TGTCGGACGA TCCGGGCCCC 
TGGCTGACCA GGCTCCTCCT GGCGGTCAAC GCGGACCGGC TCGCCGTCGT CGTCTCCTCC 
GATCATCCCG ATCTGGGCGT CCGCCGCCGG CGGGCCCAGG ATGACCCGCT GCGGCAGCTG 
CGGGCGAAGT GGACCGCCAC CCCCGCCCGG GACCTCGGGG ACCTGCGGCT CGTGACGTTC 
ACGGCCGTCG GCCCGGCGGC GCTCGCCCCC GCCGACCGGC TCGCCCGGTG GCTGCTGGAC 
CGCCCGCATG GCAAGATCGG CAACGTCTGG CGGGACGGGC TCATCCGGAT CGTCCGGGAG 
GATTCGGGGC GCACGCTCTC CCAGCGCGAC GCCCGGGCCG CCGTGACCCG GGCCGCGCGC 
GATCCCGACC TGCTGGCCGC CCGACTGATC GATCTTCCCC GGCACGCCCT CGAGGGAATC 
CTCGCCGCGG TGTCGTCCGG CGACACGCTG CCGGCCGAGC CGGTGAGACC GGGCTGGATC 
CGGCAAAATG GGCAGACGCT GCGAAACGAG TAG

Protein sequence

MSPPHTLSGP DHPGRAPGPA ESGESLATLL AGYRVHARAP RAAVAALTEQ PRTLRQLVQS 
SGLPRRSVEE ILASLGDDLR TGPDGRHVLR PASIDRYRGL IRYDELSGQT PLDPLAAVIT 
RHGPLVTTMH DLIAAAPRPR ADLDHVPATA TTVVRRAVWL RTRYDLRGAH LLCIGDHDLT 
SLAAVSLIDG LTVTVVDIDD ELLAYLDSSA RSLDVRLRCL YADLRFGLPP AVVGTADLAF 
TDPPYTPEGV ALFTGRGAQG LADREHGRVL LAYGFSDRVP TLGWKVQRAL IDQGFVFEAI 
WPGFHVYEGA EAVGARADMY VCQPTPATWK QLDRSATAAT TATAAIYTRG RQSTQSRPTR 
LTAPVLDAVA AFLATGPAGR AVFVGERREV DAVHVRLATV FDRGLPAFAS TGPGSSTGPG 
ASTEDGTVSV ATDLSDDPGP WLTRLLLAVN ADRLAVVVSS DHPDLGVRRR RAQDDPLRQL 
RAKWTATPAR DLGDLRLVTF TAVGPAALAP ADRLARWLLD RPHGKIGNVW RDGLIRIVRE 
DSGRTLSQRD ARAAVTRAAR DPDLLAARLI DLPRHALEGI LAAVSSGDTL PAEPVRPGWI 
RQNGQTLRNE