Gene Francci3_4384 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4384
Symbol
ID	3907358
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	5234882
End bp	5236642
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	69%
IMG OID	637881715
Product	metallophosphoesterase
Protein accession	YP_483459
Protein GI	86743059
COG category	[R] General function prediction only
COG ID	[COG1409] Predicted phosphohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.508778
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.535785
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGGAG TAGCCCCGCG GCTGCTCCGG CCATCGCAGT CTCGGCCGCG TAGCCGGGCT 
GGTCGCTCCA GAGCTGGAAC ACGTTCGTTC TCTCACACAT CGCTCGGTCG CACCGCTCGA 
TCGGCGACCG GTAACAGAAT ATGGGAAAAT GTCAGCCACC GGGTAACCAC CTTGCCGGCC 
GGGGCATCCG GCGAGATCGG GTCCGGTTGC CGGCGCAGGC ACGAGCACAG GCACAACTTC 
ATCGCCCCGA GGACGATTCG GACTGCTGGT TCGGCGAACG GGAGAGCTCC GCTGGTGACT 
GGTAGTCCCG ACGTCGCGCT CGGCGTTCAC CTGACCTTCG GCTCCGATCC CGCCACGTCC 
ATGGTCGTCT CGTGGCTGAC CCGAACGGCC GTCCCTCGGC CCCAGGTACG GTTCGGTCCG 
GCGGCTGGCG GATCTACCGG CTCGGTGACC GCGCTCACCC GTTCCTACAC GGACGCCCTG 
ACAAACGAGG TGGTCTTCGC CCACCATGCG CACCTGTCCG GGCTCCTGCC GGCTGCCGAC 
TACCGCTATG ACGTGGGTCA TGACGGGCGC TGGGGCTTGG CCCACGGGTC GTTCCGCACG 
GCTCCGCGGC ATCGGGCCGC CTTCAGCTTC ACCTGCTTCG GCGACCAGGG CACCGACGAG 
CCGCACGATC CGTACGGCTC GGCTGCGTCA CGCCACGTGA TAACCGGAGT GGAACGCCTC 
GCGCCACTGT TCAACCTCGC GAACGGTGAC CTGTCGTACG CCAACCAGCG CACGGATCCG 
GTTCGCGCCT GGTTCGACTG GTTCGCGATG ATCAGCGCCT CCGCCCGGTT CCGGCCGTGG 
ATGCCCTGCA ACGGCAACCA TGAGACCGAG CGGGGCAACG GAGCTCTGGG GCTCGCCGCC 
TACCAGACCT ACTTCGCCCT TCCCCAGCAC GACGAGGAGG CCTACCTCGC CGGGCTCTGG 
TACGCGTTCA CCGTCGGCGG CGTGCGGTTC GTCATGCTCA GCGCCGCCGA CGTCTGCTAT 
CAGGACAGCG GGCGGGTCTA CCTCCATGGG TACAGCGCCG GCCGGCAGAC CTCCTGGTTG 
AGACAGACCC TCAAACAGGC CCGCGCCGAT CCCGGTATCG ACTGGATCGT CGTCGGCATG 
CACCACGCCG CGGTGTCGAC CGCGGTGGAG CACAACGGCG CCGACCTCGG TATCCGGGAA 
GAATGGCTGC CGTTGTTCGA CACCTACGAG GTGGATCTGG TGCTCTGCGG CCACGAGCAC 
CACTACGAGC GCACTCATCC GCTGCGCGGG GTCGTGCCGG ACAGCGCGAC CCGGACTCCC 
CGCCCGGTCC CCGGCGCGAC GACGCCCGCC CGGAAGACCG CTGACGGAGC GGGCGCCGCG 
GCCGGTGACG GGGCCGGTGA CCTGCTCGAC ACCTCGGCGG GCACCGTCCA CCTGCTCGTG 
GGCACCGGAG GATCCTCGTC GCCGTCCGCG CACGCACTGT TCGATCCACC CGCCTGCTGG 
GTCATCGTCG GCGTGCACGA ACAGGATCCC GGCCGGTGGC ATCGCCAATC GGTCCGGGCG 
AGAGAGGACG CGCCCTGGCT CGCCTTCCGG GCACCGGAGC ATCCATACGC CTTCGCGGCT 
TTCGAGGTGG ATCCAGGTGA ACCGGGCGGC TCGACGAGCA TCCGGGTGAC CGTGTACGAC 
TCCAGTGCAC CGACGCCGGT CCCGTTCGAC CGGTTCACCC TCGTCCGGCC ACGCGCCGAC 
GCGGCCGTGC CCACCACCTG A

Protein sequence

MAGVAPRLLR PSQSRPRSRA GRSRAGTRSF SHTSLGRTAR SATGNRIWEN VSHRVTTLPA 
GASGEIGSGC RRRHEHRHNF IAPRTIRTAG SANGRAPLVT GSPDVALGVH LTFGSDPATS 
MVVSWLTRTA VPRPQVRFGP AAGGSTGSVT ALTRSYTDAL TNEVVFAHHA HLSGLLPAAD 
YRYDVGHDGR WGLAHGSFRT APRHRAAFSF TCFGDQGTDE PHDPYGSAAS RHVITGVERL 
APLFNLANGD LSYANQRTDP VRAWFDWFAM ISASARFRPW MPCNGNHETE RGNGALGLAA 
YQTYFALPQH DEEAYLAGLW YAFTVGGVRF VMLSAADVCY QDSGRVYLHG YSAGRQTSWL 
RQTLKQARAD PGIDWIVVGM HHAAVSTAVE HNGADLGIRE EWLPLFDTYE VDLVLCGHEH 
HYERTHPLRG VVPDSATRTP RPVPGATTPA RKTADGAGAA AGDGAGDLLD TSAGTVHLLV 
GTGGSSSPSA HALFDPPACW VIVGVHEQDP GRWHRQSVRA REDAPWLAFR APEHPYAFAA 
FEVDPGEPGG STSIRVTVYD SSAPTPVPFD RFTLVRPRAD AAVPTT