Gene Francci3_1521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1521
Symbol
ID	3904987
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1821425
End bp	1823005
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	74%
IMG OID	637878858
Product	precorrin-2 C20-methyltransferase / cobalt-factor II C20-methyltransferase / precorrin-3 methyltransferase
Protein accession	YP_480626
Protein GI	86740226
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1010] Precorrin-3B methylase [COG2243] Precorrin-2 methylase
TIGRFAM ID	[TIGR01466] precorrin-3B C17-methyltransferase [TIGR01467] precorrin-2 C20-methyltransferase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0252228
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCCGT CGAAGGGCCG GCTGTGGGGA GTCGGGGTTG GACCGGGGGA TCCCGAGCTC 
GTCACCCTCA AGGCGGCCCG CCTGATCCGT GACGCCGACG TGATCGCCTA CCACAGCGCC 
CGGCACGGCC GCAGCATCGC CCGGTCGGTC GCCGCGAGCC AGCTGCGCGG CGACCAGATC 
GAGGAGGCGC TGGTCTACCC GGTCACCACC GAGACGACCT CCCACCCCGG TGGCTACCGC 
GGCGCGATCG ACGAGTTCTA CGAGGACTGC GCCAAGCGGC TGGCCGTCCA CCTCGACGCC 
GGCCGGGACG TCGTGGTCCT CAGCGAGGGT GACCCGTTCT TCTACGGCTC GTTCATCCAC 
CTGCACCGGC GCCTCGCCGA CCGGTACCCG ACCGAGGTCG TGCCGGGGGT GACGTCCCTG 
TCGGCGGGGT GCGCGGTGCT CGGCCGGCCG CTGGTCGAGG GCAACGAAGT CCTCACCGTG 
CTGCCGGGCA CGCTGCCGCC GACGGTCCTC GCCGAGCGTA TCGCCGGCAC GGACACCGCC 
GTCGTGCTCA AGATGGGACG GACCTTCCCG GGGGTCCGGG ACGCCTTCAC CGCCGCGGGA 
CGTCTCGCGG ACACCTGGTA CGTGGAACGG GCCACCACCT CCGGCCAGCG CATCGCCCCG 
CTCGGTGCGG TAGACCCGGC CACGGTGCCG TACTTCTCGC TCGCGGTACT GCCGAGCCCG 
GTCCGGGGGC CGGACGATCC GGCGCCGCTG CGCGCGTCGC AGGCGGGCTG GGTACCAACG 
GCGCCCACCG TTGGTAAGGC TGGCGCCGTT GGTACCGGCG GCACGCCCGG CGCGGGGGAG 
GTCGTCGTGG TGGGCCTCGG ACCGGGCGCC GCGGGCTGGT TGACGCCGCA GGCCGCCGAG 
GCGCTGGCCG CCGCCGACGA CCTCATCGGC TACGGCCCCT ACCTCGACCG GGTGCCGGTC 
GATCAACGCC AGCGCCGGCA CGCCTCGGGG AACACCGTCG AGGCCGAGCG CGCCGAGCTC 
GCCCTCGAAC TGGCGGCCGG CGGCGCGAAC GTCGCCGTGG TCTCCTCCGG TGATCCCGGG 
GTCTTCGCGA TGGCCACGGC CGTCGTCGAG GCCGCGGCGG CGGAGCGGTT CGCGGGCGTC 
GAGGTGCGGG TCGTGCCCGG GCTGACCGCC GCGCAGGCGG TGGCGAGCCG GGTCGGGGCG 
CCACTCGGCC ACGACTTCTG CGTGCTGTCG CTGTCCGACC GACTCAAGCC GTGGGAGGTC 
ATCGAGCGGC GGCTGCGGGC GGCGGCCGCG GGCGACTTCG TCCTGGCGCT GTACAACCCG 
GCTTCCCGTA CCCGTCGCCA TCAGCTGGAG CGGGCCCACG AGGTGCTGCT CGAACACCGC 
CCCTCGGACA CGGTGGTGGT TATCGGCCGG GATGTCGGCG GTCCCACCGA GAGCATCACC 
GTGACGAGCC TCGGTGCGTT CGACCCGGCC GAGGTCGACA TGCGCTGCCT GCTGCTCATC 
GGCTCGTCGA CGACCCGGGT GGTGCGCCGT GGCCCCGGCC GGGACCTCGT GTTCACTCCA 
CGTCGTTACC CGGTCACCTA G

Protein sequence

MVPSKGRLWG VGVGPGDPEL VTLKAARLIR DADVIAYHSA RHGRSIARSV AASQLRGDQI 
EEALVYPVTT ETTSHPGGYR GAIDEFYEDC AKRLAVHLDA GRDVVVLSEG DPFFYGSFIH 
LHRRLADRYP TEVVPGVTSL SAGCAVLGRP LVEGNEVLTV LPGTLPPTVL AERIAGTDTA 
VVLKMGRTFP GVRDAFTAAG RLADTWYVER ATTSGQRIAP LGAVDPATVP YFSLAVLPSP 
VRGPDDPAPL RASQAGWVPT APTVGKAGAV GTGGTPGAGE VVVVGLGPGA AGWLTPQAAE 
ALAAADDLIG YGPYLDRVPV DQRQRRHASG NTVEAERAEL ALELAAGGAN VAVVSSGDPG 
VFAMATAVVE AAAAERFAGV EVRVVPGLTA AQAVASRVGA PLGHDFCVLS LSDRLKPWEV 
IERRLRAAAA GDFVLALYNP ASRTRRHQLE RAHEVLLEHR PSDTVVVIGR DVGGPTESIT 
VTSLGAFDPA EVDMRCLLLI GSSTTRVVRR GPGRDLVFTP RRYPVT