Gene Francci3_3473 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3473
Symbol
ID	3905207
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4141243
End bp	4143243
Gene Length	2001 bp
Protein Length	666 aa
Translation table	11
GC content	72%
IMG OID	637880795
Product	polysaccharide biosynthesis protein CapD
Protein accession	YP_482555
Protein GI	86742155
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1086] Predicted nucleoside-diphosphate sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.467717
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGAGAC GTAGAGTAGA CGGAGTGGGT CATGGTCGGT GGACAGCGCA CATCGCACGG 
CGCGTCTCCC GGCTCAACCT CCGTCAGCGG GTCGGCCTGC AGATCACTCT GGACAGTGCG 
GCGCTGGTCC TGGGCCTCAT CTCGGCCCAG ATCGGCCGCC TGGACTTCAC GCTCGGCGCG 
CTGAGCGATC TCGGCTTCTG GGTCATCTGC ACGCTCGCCG TCTGCGTGCT CCACTTCCTG 
GGCACCGCCC TGCACCTCTA CCTGGGGCGC TACCGCTTCG GCGGCTTCGA GGAGGTCCTC 
GGCCTGCTCG TGTCGGTCCT GCTCACGGTC GTCAGCGTGG CCGTCGTCAT CGCCGCGTTC 
GGCTCCCCGA GACCCGTCCC GCTGAGCGTG CCGCCACTGG GCGGCGCGGT GGCCCTGGTC 
GTGATGTTCG GCATCCGCTA CCTCTGGCGG CTGACCGAGG AACACCTCCG TCGGCCGAGC 
AGGGAGCACG CCGAACCGCT CCTCGTGTTC GGCGCCGGTG ACGGGGCTGA ACGGGTACTG 
GCGGCCATGC TGCGCACCCG GAACAGTCCT TACTACCCGG TCGCGCTGCT CGACGACGAC 
CCGAGCACAC ACAACCTCCA GCTACTCGGG GTCCGGGTAC GTGGTGGCCG GGAGCGAATC 
GGCGCCGTCG CCGAGTCGAC CGGGGCCAGG ACCCTGCTCG TGGCGATCCC CAGCGCTGAC 
GGCCCACTGC TGCGGGAGAT CAGCGCAATC GCCGAGGGCG CCGGGCTGAC CGTGAAGGTG 
CTTCCCCGCG TCGCGGACCT GATCGACGGG CGGGTCGGCG TCGGGGACAT CCGCGACCTC 
GACCTCGCCG ACCTCCTCGG CCGGCGGCAG ATCCGCACCG ACATGTCCGC CGCCGCGAGC 
TACCTCGCGG GCCGACGGGT GCTCGTGACG GGGGCGGGCG GATCGATCGG TTCGGAGCTG 
TGCCGTCAGA TCTCCGGCTA CGGGCCGGCC GAACTGATCA TGCTGGACCG GGACGAGTCG 
GCACTGCGCG CGGTGCAGCT GTCGATCTCC GGCCGGGCGA TGCTCGACGA CGACGCCATC 
GTGCTGGGCG ACATCCGCGA CATCGACCTG ATGACCACGC TGTTCACGGA GCGCCGGCCC 
GAGGTCGTCT TCCACGCCGC CGCGCTCAAA CACCTCCCGC TGCTCGAACG CTTCCCCGGC 
GAGTCGGTGA AGACCAACGT CTGGGGCACT CTGACGATCC TGGAGACGGC CGTGGCCTGC 
GGCGTCGACC GGCTGGTCAA CATCTCCACG GACAAGGCGG CGAACCCGAC GAGCGCCCTC 
GGCTACTCGA AGCGGATCAC CGAGCGGCTC ACCGCGTGCC TCGCCCGCCG GGCCCGCGGA 
ACGCTGGTCA GCGTCCGGTT CGGCAACGTC CTGGGCAGCA ACGGCTCCGT CCTGACCGTC 
TTCGCCGGCC AGCTGGCCGC CGGCGGGCCG ATCACCGTCA CCCACCCCGA GGTCACCCGG 
TACTTCATGA CCATCCACGA GGCGGTGCAA CTGGTCCTGC AGGCCGGGGC GCTGGGATCA 
CCCGGCGAGG CCCTCGTGCT CGACATGGGC GAGCCGGTGC GCATCGCGGA CGTGGCCGCC 
CGGCTCGTGG CTCGGGAGAA CCGGCCGATC GAGATCGTCT ACACCGGGCT CGGCCCCGGC 
GAGAAGCTCC ATGAGGAGCT CCTCGGTGCG GGCGAGGACG ACCATCGACC ACACCACCCG 
CTGATCTCGC ACGTGGACGT GCCCGCCCTG GACCCGACCC ACGCCCTCGC CCTCGATCCC 
TGGGCCCCGC CGGAGGAGGT GCTGGCCGAA CTCGCGGCCC TCGCCGGCGC GGACGCCGCG 
GCGGACGAGG TCCCGGCAGG CGCGGACCGA CCCGGGGACG GGGGCGCGAC CGCAGGCGGA 
CCCCTGGCCG CCGCGGACGT GACCGGGCGG ATTCCCGTCC AGCCCACGGC GTCCAACCAT 
CAACCGCATC CGGCCCGGTG A

Protein sequence

MWRRRVDGVG HGRWTAHIAR RVSRLNLRQR VGLQITLDSA ALVLGLISAQ IGRLDFTLGA 
LSDLGFWVIC TLAVCVLHFL GTALHLYLGR YRFGGFEEVL GLLVSVLLTV VSVAVVIAAF 
GSPRPVPLSV PPLGGAVALV VMFGIRYLWR LTEEHLRRPS REHAEPLLVF GAGDGAERVL 
AAMLRTRNSP YYPVALLDDD PSTHNLQLLG VRVRGGRERI GAVAESTGAR TLLVAIPSAD 
GPLLREISAI AEGAGLTVKV LPRVADLIDG RVGVGDIRDL DLADLLGRRQ IRTDMSAAAS 
YLAGRRVLVT GAGGSIGSEL CRQISGYGPA ELIMLDRDES ALRAVQLSIS GRAMLDDDAI 
VLGDIRDIDL MTTLFTERRP EVVFHAAALK HLPLLERFPG ESVKTNVWGT LTILETAVAC 
GVDRLVNIST DKAANPTSAL GYSKRITERL TACLARRARG TLVSVRFGNV LGSNGSVLTV 
FAGQLAAGGP ITVTHPEVTR YFMTIHEAVQ LVLQAGALGS PGEALVLDMG EPVRIADVAA 
RLVARENRPI EIVYTGLGPG EKLHEELLGA GEDDHRPHHP LISHVDVPAL DPTHALALDP 
WAPPEEVLAE LAALAGADAA ADEVPAGADR PGDGGATAGG PLAAADVTGR IPVQPTASNH 
QPHPAR