Gene Francci3_2157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2157
Symbol
ID	3906757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2526089
End bp	2527858
Gene Length	1770 bp
Protein Length	589 aa
Translation table	11
GC content	73%
IMG OID	637879492
Product	metal-dependent hydrolase
Protein accession	YP_481258
Protein GI	86740858
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3454] Metal-dependent hydrolase involved in phosphonate metabolism [COG3639] ABC-type phosphate/phosphonate transport system, permease component
TIGRFAM ID	[TIGR02318] phosphonate metabolism protein PhnM

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.321413
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGCGC TGCTGGGGCT GCTCGGCCTG GCCGGGTGGG CCTTCGCCGC GCTGTCGATC 
AACGTCGCGA CGCTGATCGA CAGCGGGCGG AACGCGGCCG ACTTCGCCGC CCGGATGCTC 
CCCCTGGACT TCCCCACCGC GGGGGAGCTG CTGCGCCTGA CCGGCCAGAC CATGTCGATC 
GTCATCTGCG CCACGCTGCT GTCGGTGGTG CTCAGCACGG GGCTTGCGGT CTTGGCTGCC 
GGGAACACGG CGCCGCACCG CGGTGCACGG TTCGGCGCGC GGACAGTGAT CGTCGCGGCC 
CGCGCGGTGC CGGACGTGGT GCTGGCGACC GTGTTCTTTC GGCTGTTCGG GTTCGGCGCG 
CTGGCCGGGG TTCTCGCGAT GGGACTGCAT TCGGTCGGCA TGGTCGGCAA GCTCTACGCC 
GACGCGGTCG AGCAGATCGA CGAGGGCCCG CGTGAGGCCA TGCGCGCGGG CGGCGCGGGC 
CGTGGGAGCT GGTGGCCGGC GTGCTGCCGC AGGTGCTGCC CGCGTTCGTG GCGACCGCGC 
TGCACCGGCT GGACATCAAC CTGCGGGTCT CGGTCGTCCT CGGCTTCGTG GGTATCGACG 
GGCTCGGCCG CGCCATCGCG ACCGGCTGCT GATCGTGTGT GTGCGGGGCA TCCCCGATCT 
GGTGCTGGCG ATCGTGTTCG TGGTGATCAC CGGGCTCGGT GCGGTCGCCG GGGTGCTCGC 
GCTGGGCGTC GGTGCTGTCG GGCTGCTCGG CAAGCTCGTC GCGGACTCCG TGGAAGAGGT 
CGACCCGGGT GTCGAGGACG CGCTGCGCGC CACGGGATCG AGAACGAGCA GCTGCCCCGA 
CCGGGCGCCG AGCTGCCGAT CGAGTTCGCG CTGCTGTCCT TCGAGGGCAA GCTGCGGGCC 
GCGGGCGTGA CGACCGTGTT CCACGGCATC TCCTTCGAGG ACACCCACCA CGACATCCCG 
CGCAGCGTGG GCCAGGCGGA GAAGACGTGC GAGGCGATCG ATGCTTATAC CGGCGGGCTC 
GTCGACCACC GGATCCTGTA CCGGCTCGAC GTGCGCAGCC CGGAAGCGCT GTCCGCGCTG 
GCGCGGCGGT TGGACCAGGT TCCCGACGGC GCCCTGGTCT CCCACGAGGA CCACACCCCG 
GGCCAGGGCC AGTACGCCGT CCGCGAGCAC TACGAGCGCT ATTTGATGGG CAGCCGCGGC 
ATGTCCGACG CGGAGGCTCG CGAGCATGTC GACCAGCTCA TCGCCGACCG GGACGGCAGG 
CTCGACATCC GCGAGGAGGC CCTGGTCTGG CTCGCCGCGC GCTCGGCGCG AATCCGGCTG 
CTCGGGCACG ATCCCAGCTC GGCCGCCGAG ATCGCCGAGC TGCGGGACCG CGGCTGCGCG 
GTCGCCGAGT TCCCCACCAC GATCGAAGCG GCGGAAGCCG CCCGCGCCCA CGGACTTCCC 
GTCGTCATAG GCGCCCCGAA CATCCTGCGG GGACGTTCCC ACAACGGCAA CGCCTCCGGC 
CGTGACCTGG TCGGCCGCGG CCTGGTGACC GCGCTGGTGT CGGACTACCT GCCCTCCGGT 
CTGCTCGCGG CCGCCATGCT GCTCGCCGAG CAGGGGCTCG CCACCCTGCC GGCCGCCATC 
GGCCTGGTGA CCGCCGGGCC GGCCGAGGTC GCCGGACTTC CCGACCGCGG TCGGCTCGAG 
CCGGGGCTGC GCGCTGACTT TGTGCTGGTC GAGCCGCGCC GCCCGTGGCC GGTGGTGCGG 
TCCGTGTTGT CATCCTGGGG TGTCTGGTGA

Protein sequence

MAALLGLLGL AGWAFAALSI NVATLIDSGR NAADFAARML PLDFPTAGEL LRLTGQTMSI 
VICATLLSVV LSTGLAVLAA GNTAPHRGAR FGARTVIVAA RAVPDVVLAT VFFRLFGFGA 
LAGVLAMGLH SVGMVGKLYA DAVEQIDEGP REAMRAGGAG RGSWWPACCR RCCPRSWRPR 
CTGWTSTCGS RSSSASWVST GSAAPSRPAA DRVCAGHPRS GAGDRVRGDH RARCGRRGAR 
AGRRCCRAAR QARRGLRGRG RPGCRGRAAR HGIENEQLPR PGAELPIEFA LLSFEGKLRA 
AGVTTVFHGI SFEDTHHDIP RSVGQAEKTC EAIDAYTGGL VDHRILYRLD VRSPEALSAL 
ARRLDQVPDG ALVSHEDHTP GQGQYAVREH YERYLMGSRG MSDAEAREHV DQLIADRDGR 
LDIREEALVW LAARSARIRL LGHDPSSAAE IAELRDRGCA VAEFPTTIEA AEAARAHGLP 
VVIGAPNILR GRSHNGNASG RDLVGRGLVT ALVSDYLPSG LLAAAMLLAE QGLATLPAAI 
GLVTAGPAEV AGLPDRGRLE PGLRADFVLV EPRRPWPVVR SVLSSWGVW