Gene Francci3_1565 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1565
Symbol
ID	3904797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1877388
End bp	1878578
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	66%
IMG OID	637878902
Product	methyltransferase type 12
Protein accession	YP_480670
Protein GI	86740270
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.663655
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.440278
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGACC AGTCCACCGC CTGCCCCGCC TGCGGCGGTT CCCGTCTCAC CTCCGTCTAT 
ACAAAGGACG ACGTCCCGTC GCACAGTTGT CTGCTGCTGG CCGACGAGGA CGAGGCCCGG 
GCGTTCCCGA AGGGTGATCT GCGGATCGCC TTCTGCGAGC GCTGCGGCTT CATCATGAAC 
ACGGCCTTCG ATCCGACCAA GAATCAGTAC TCCGCCCGGT ACGAGGAGAC GCAGGCATTC 
TCCACCCGAT TTCAGGAGTT CGCGCGGGAC CTCGCCAAGC GCTGGACCGA CAAGTACGAT 
CTGTACGGGA AGACGGTCCT GGAGATCGGG TGCGGCAAGG GTGAGTTTCT CGTCCACCTG 
GTGGAGCAGG GTGCCGGCGC CGGCATCGGG ATCGACCCGG GTGTCCGGCC CGAGCGCATC 
ACCAGCCCGG TTGCCGGCCG GCTGACCTGG ATCACGGACC TCTACTCCGA GCGGTATGCG 
CACCTGACCG CCGATGCCGT CGTGTGCCGG CACACCCTGG AGCACATCGC GCCGGTCGGC 
GACTTCATGC GGATGATCCG GGCCGCGCTC GGTGACCGGA CCGATATCCC GGTCCTCTTT 
GAGCTGCCGG ACGTCCTGCG GGTGCTGCAG GAGGCGGCGT TCTGGGATGT GTACTACGAG 
CACTGCTCCT ATTTCAGCGC CGGTTCGCTG GCGAGGTTGT TCCGAGCTAC CGGGTTCGAG 
GTGCTCGACG TCTCCCTCGA CTATGACGAT CAGTACCTGC TGATCGAGGC GCGGCCGTCC 
ACCGTTCCGG CGGCCGGTGA CCCGCTGCCG ATCGAGGACG ACCTGGCCAC CCTGCGCGTC 
GGGGTACGGC ACTTCCAGCG TGAGGTGGCC ACGACGCTGA ACCGGTGGAG CGAGATGCTG 
TGGCGCGGGC ACCAGCGCGG CGAAAAGGCG GCGATCTGGG GTTCGGGCTC CAAAGGTGTG 
TCGTTTCTGG CGACCCTCGG CCCGGCCGCC GACCTGGTCC GCTACGCCGT CGACATCAAC 
CCGCACAAAC ACGGCATGTT CATGGCGGGC AGCGGCCACC GTATCGTCCC GTCCGAGTGG 
CTGCGGGAAG ATAGGCCGGA TCTTCTGATC ATCATGAATC CGATCTATCG TGACGAGATC 
GCGGGGGAGT TGACCCGGCT GGGCGTCGAC ACCGAGCTGA GGGCCGTCTG A

Protein sequence

MTDQSTACPA CGGSRLTSVY TKDDVPSHSC LLLADEDEAR AFPKGDLRIA FCERCGFIMN 
TAFDPTKNQY SARYEETQAF STRFQEFARD LAKRWTDKYD LYGKTVLEIG CGKGEFLVHL 
VEQGAGAGIG IDPGVRPERI TSPVAGRLTW ITDLYSERYA HLTADAVVCR HTLEHIAPVG 
DFMRMIRAAL GDRTDIPVLF ELPDVLRVLQ EAAFWDVYYE HCSYFSAGSL ARLFRATGFE 
VLDVSLDYDD QYLLIEARPS TVPAAGDPLP IEDDLATLRV GVRHFQREVA TTLNRWSEML 
WRGHQRGEKA AIWGSGSKGV SFLATLGPAA DLVRYAVDIN PHKHGMFMAG SGHRIVPSEW 
LREDRPDLLI IMNPIYRDEI AGELTRLGVD TELRAV