Gene Francci3_3820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3820
Symbol
ID	3905568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4578408
End bp	4580264
Gene Length	1857 bp
Protein Length	618 aa
Translation table	11
GC content	72%
IMG OID	637881146
Product	alkaline phosphatase
Protein accession	YP_482899
Protein GI	86742499
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3540] Phosphodiesterase/alkaline phosphatase D
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00587129
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.244243
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCGTG ACGCCGCGGC CGGCTCTCCG CGTTCCCGCC GATTCCCGCG GGCGCCCTCG 
CCGTCAGCCG CCACCGGCTC GCCGTCAGCC GCCACCGGTC AGACTGGTCG ACCGGCCGGC 
ACCGATCCGT CGGCACGCGC CGATCCGGGC ACCGGTCCTC GCGCCGCCGC CCGGTCCGGC 
CACGGGACGA ACCCGGGGGC CGATCCACGT CGCCGTGCCG TCCTGCTCGG CGGCCTCGGG 
CTGGCGGGCG CCGCGCTGGG CGGGGCGAGC CTGGCGGCCT GCGGCGGCTC CGGCGGTTCG 
ATCCCGGCCC CCGCGCCGAC CCTGCGGGCA CCCACCCCGA TCGCGGGCGT CACCGACGGG 
GTCTTCGGGC TCGGGGTCGC CAGCGGCGAC CCGTTGCCGG ACGGCGTCAT CCTCTGGACC 
CGGCTCGCGC CGAGGCCGAC CGAGGGCGGC GGCATGCCCA CGCGGGACAT TGAGGTCGAC 
TGGCAGATCG CGACGGACGA GGGTTTCCGC GATGTGGTGC GCGCCGGCAC GCAGACCGCG 
CAGACGGCGT TCGCGCATTC CGTCCACGTC GACGTCCGCG GACTCGCGCC GGAGCGTGAC 
TACTTCTACC GGTTCCGTGC CGGCACCGTG CTCAGTCCAG TCGGCCGGAC CCGGACGGCC 
GCGGCACCTG GGAGGGGACC GGAATCGACC GGCGGTGCCC TGACCTTCGC GCTGGCCTCG 
TGCCAGGACT TCCAGAACGG GTACTGGCCG GCCCTCGACG GCATCGCCAC CGACGCGCCG 
GACCTCGTCG TCCACGTCGG CGACTACATC TACGAGTACG ACCCGAAAAG CAACTACCCG 
GACCGGCGGC ACACCACCCC GCAGCGGCCC GGTCTGGACC AACTCCAGAC GCTGGCGGAC 
TACCGCAACC GGTACGGCCA GTACAAGTCC GATCCTGCCC TGCAGGCCGC TCATCACGTG 
GCCCCCTGGG TCGTCACCTG GGACGATCAC GAGGTCGAGA ACAACTACGC CGGACTGATC 
GACGAGGCCG GCGACGCCGG GGAGCAACGG CAGGACCCTG CGGTGTTCGC CCGCCAGCGT 
GCCGCCGCCT ACCAGGCGTA CTACGAACAC ATGCCGATCC GCGCGGAGCT GAATCCGGGA 
TCGCCCGACA TGCGGATCTA CCGGCGGTTC GTGTTCGGGA ACCTGGTGAC GTTCAACGTC 
ATGGACACCC GGCAGTACCG GACCCGGCAG CCCGGCGACT CCCCGCAGGG CATCGGGCTC 
GCATCCCTGG GCCGGGACAA CACGGCCGGC ACGATGGCCG GCGCCGCCCA GGAACGCTGG 
TTGCGCGACG GCCTGACCAC GTCGCGGACC CGCTGGAACG TCCTCGCCCA GCAGACGATG 
ATGGCCCAGC TGAACGGGCA GCTACCCCTC GGCGAGGGAC CACGGCTGGC CAACCTGGAT 
CAGAACGACG GGTACGGCCC CTACCGGACC CGGCTGCTGT CGGAGATCCG CGACAGCGGC 
GTGCGCAACC CGGTGGTGCT CTCCGGTGAC ATCCACTGCG CCTGGGTAAA CGACCTCCGG 
GTCGATTTCG ACCGGCCCGA GACGCCGGTC GTCGCGACGG AGTTCGTCTG CACCTCGATC 
AGCTCGGCCT TCTTCCTCGT CAGCGAGGAC TTCATCCGGC AGAACAATGC CCGACTCAAC 
CCGCATGTCC GGTATTTTCG CGGTGACCGG CGAGGTTACA CGCGCGTTCG CGTCACCCCG 
GACGAATGGC GCGCGGACAT GCGGGTCGTC GCCGACATCG CCCATCGCCA CTCGCCCACG 
TCCACGGATG CCACCTGGGT GGTCGAGAAC GGGCGGCCCG GCGCGCGGCC GGCCTGA

Protein sequence

MTRDAAAGSP RSRRFPRAPS PSAATGSPSA ATGQTGRPAG TDPSARADPG TGPRAAARSG 
HGTNPGADPR RRAVLLGGLG LAGAALGGAS LAACGGSGGS IPAPAPTLRA PTPIAGVTDG 
VFGLGVASGD PLPDGVILWT RLAPRPTEGG GMPTRDIEVD WQIATDEGFR DVVRAGTQTA 
QTAFAHSVHV DVRGLAPERD YFYRFRAGTV LSPVGRTRTA AAPGRGPEST GGALTFALAS 
CQDFQNGYWP ALDGIATDAP DLVVHVGDYI YEYDPKSNYP DRRHTTPQRP GLDQLQTLAD 
YRNRYGQYKS DPALQAAHHV APWVVTWDDH EVENNYAGLI DEAGDAGEQR QDPAVFARQR 
AAAYQAYYEH MPIRAELNPG SPDMRIYRRF VFGNLVTFNV MDTRQYRTRQ PGDSPQGIGL 
ASLGRDNTAG TMAGAAQERW LRDGLTTSRT RWNVLAQQTM MAQLNGQLPL GEGPRLANLD 
QNDGYGPYRT RLLSEIRDSG VRNPVVLSGD IHCAWVNDLR VDFDRPETPV VATEFVCTSI 
SSAFFLVSED FIRQNNARLN PHVRYFRGDR RGYTRVRVTP DEWRADMRVV ADIAHRHSPT 
STDATWVVEN GRPGARPA