Gene Francci3_3938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3938
Symbol
ID	3906897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4715392
End bp	4716726
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	70%
IMG OID	637881265
Product	methyltransferase type 12
Protein accession	YP_483017
Protein GI	86742617
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.16065
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.145676
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCCG CAACCCCGGC CCAGCGCGGT AGTGGCACCG CCGAGGCCGA CGCGACCCAG 
AAGCAGGCGA CCCAGAAGCA GGATGCTCCC GGCGGCATCG CCACGGCGGT AATCGCCTGC 
CGGTCCTGCG GCGGACCGGC CCCGCGCCTG TTCCTCTCCC TGGGGTCCAC CCCCATCGCC 
AACCGCCTGG TGCGCGCCGA CGCCCTCGAC GCGACCGATC CGTCGTTCCC GCTTGAGGTC 
GGCTTCTGCG AGGCCTGCGC ACTCGTCCAG CTCACCCACG AGCTGCCGGC GTCCGAGATC 
TTCGACGAGG ACTATCCCTA CTTCTCCTCG TTCTCCGACA TGCTCGTCCG CCACGCGGAG 
AAGCACGTGA TCGACCTGAT CGCGAGCCGC AACCTCGGGC CGGACAGCCT GGTGGTCGAG 
GTCGCCAGCA ACGACGGCTA CCTGCTGAAG GCGTTCGTCG AGCGGGGCAT CCCGGTCCTC 
GGGATCGAGC CGACCCCGGG CCCGGCCGCG GCCGCCCGGG AGGCGGGCGT GCCGACCCGC 
GAGGAGTTCT TCGGCGCGGA GCTCGCCCGT CAGCTCGTCG CGGAGGGTCG CAAGGCCGAT 
GTGATCATAG CGAACAACGT GATGGCCCAC GTCCCGGACC TCAACAGCTT CGTCGAGGGC 
TTCTCGATCC TGCTCGCCGA CGGCGGCCTC GTCGACGTCG AGAACCCCGG GGTCGGCGCG 
TTGCTGGCCC ACACCGAGTT CGACACGGTC TACCACGAGC ACTTCTGCTA CTTCTCCACG 
ATCGCGGTCG ACGCCCTGAT GCGCCGGCAC GGCCTCGCGC TCGTCGGCGT CCAGGAGTTC 
CCCGAGCTGC ACGGCGGCAC CCTGCGGTGG AGCATGCAGC ACACCGCCAC CGCGGACCCG 
GCCGAGTCGG TGGCGGCGGT GCTCGACGCC GAGCGGGCCG CCGGGCTCGA CACGTTCGAC 
CGGTACGCCA GCTTCGGCGA CGACGTCCGC GCCGTGCAGG ACGAGCTGGT GGCGTTGCTG 
CGCTCGCTGC GCGCCGACGG TAGGACCATC GCCGCCTACG GCGCGGCGGC CAAGGGAGCG 
ACCCTGCTGA ACTCCAGCGG CATCGGTACC GACCTGCTCG ATTTCGTCGT CGACCGCAAC 
ATCCACAAGC AGGGCCGGTA CCTGCCCGGC GCCCGGTTGC CGATCCTCGA TCCTGCCGTC 
CTGCTGGAGC GGCAGCCCGA CTACCTGCTG CTGCTGGCGT GGAACGTGAA GAAGGAGATC 
ATCGCCCAGC AGGCCGAGTA CGCCGCGCGC GGTGGCTCCT TCATCGTGCC GGTTCCCCGG 
CCCGTAGTGC TGTAG

Protein sequence

MSSATPAQRG SGTAEADATQ KQATQKQDAP GGIATAVIAC RSCGGPAPRL FLSLGSTPIA 
NRLVRADALD ATDPSFPLEV GFCEACALVQ LTHELPASEI FDEDYPYFSS FSDMLVRHAE 
KHVIDLIASR NLGPDSLVVE VASNDGYLLK AFVERGIPVL GIEPTPGPAA AAREAGVPTR 
EEFFGAELAR QLVAEGRKAD VIIANNVMAH VPDLNSFVEG FSILLADGGL VDVENPGVGA 
LLAHTEFDTV YHEHFCYFST IAVDALMRRH GLALVGVQEF PELHGGTLRW SMQHTATADP 
AESVAAVLDA ERAAGLDTFD RYASFGDDVR AVQDELVALL RSLRADGRTI AAYGAAAKGA 
TLLNSSGIGT DLLDFVVDRN IHKQGRYLPG ARLPILDPAV LLERQPDYLL LLAWNVKKEI 
IAQQAEYAAR GGSFIVPVPR PVVL