Gene Francci3_2299 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2299
Symbol
ID	3904833
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2679418
End bp	2681784
Gene Length	2367 bp
Protein Length	788 aa
Translation table	11
GC content	76%
IMG OID	637879630
Product	protoporphyrin IX magnesium-chelatase
Protein accession	YP_481396
Protein GI	86740996
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1239] Mg-chelatase subunit ChlI
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.291711
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0239656
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTATCCG TCGTGTCGAT CCTGTCGATC CTGTCGATCC TGTCAGCCGC AGCCGGTGCA 
CACGACGCAC CGGCGACACC CGCTTGCCTC GACGGCGTCG ACACCGTGGT GAGCTTCCCG 
CTGTCGGCGG TGGTCGGCAT GGACGACCTG CGCCTGGCCC TGCTGCTCAA CGCGGTCTCC 
CCCACGCTGG GCGGAATCCT CGTGCGTGGG GAGAAGGGCA CCGCCAAGTC CACCGCCGTG 
CGCGGCTTGG CCGCCCTGCT GCCCCCGGTG ACGGTCACGG AGGGCTGCCG GTTCTCCTGC 
GCGCCCGACG CGCCGTTACC GGACTGCCCC GACGGCCCGC ATCCCGCGCC GTCGCCGTCA 
CTGACCCGTC CGGCCCGGCT GGTGGAACTA CCCGTGGGCG CCTCCGAAGA CCGGCTAACC 
GGTTCCCTCG ACCTGGACCG GGCGTTGGCC GACGGGGTCA GCGTTCTGCG CCCGGGTCTG 
CTCGCCGCCG CCCACCGCGG GCTGCTCTAC GTCGACGAGG TCAACCTGCT GGGGGACCAT 
CTCGTTGACC TGCTTCTCGA CGCCGCCGCC TTCGGGGTCG CCCACGTCGA ACGCGACGGG 
GTGTCGGTGC GCCATCCGGC GGTGTTCCTG CTGGTCGGGA CGATGAACCC GGAGGAGGGC 
GAGCTGCGTC CGCAGCTGCT CGACCGGTTC GGGCTGACCG TGCACGTCGC GGCCAGCCGT 
GACCCGGCGG TGCGCGCGGA GGTCGTCCGC CGACGGCTGG CGTTCGAAGC CGACCCGGCC 
GGGTTCGCCG CGACCTGGGC GGACGCGGAG GCGGAACTCG CGGCCCGGGT CGTCGCCGCC 
CGCGGCCGGC TCGGCACGGT CCGGCTCACC GACGCGGCGC TGCGGGCCGT CACCGCCATC 
TGCGCCGGCT GCGACGTCGA CGGCATGCGC GCCGACGTGG TGCTGGCCAA GACCGCGATG 
GCACTCGCCG CGTGGGCGGG GCGCGCCACG GTGCTCGCCG CCGACATCCG TACCGGTGCC 
CGTCTCGCGC TACCGCATCG CCGCCGCCGC GGCCCGTTCG ACGCCCCCGG AATGGACGAC 
GAGACCCTCG ACGCCGTCCT CGACGAGGCC CTGGCCGCTC TCGACGAGCG CGTCGGGGCC 
GAACGCGAGG CCGGCGAATG TGAAGCCGAC GAAGAAGCCG GCGAAGAAGC CGGCGGATCC 
GGTGCCGGGG AATCCGGTGC CGGGGAATCC GGGGTACCGG TGAACGATGC GCGCCCCGAT 
GACGACCCGC CCGACGGCGG CGGTTCGGGG GGCGCGCCCC GTGGTGACGG CGGTTCCCAC 
GGCTGCGACG GTGCGGGGGA TGGGAACCGC GGCGCGGGGA ACGGCGGGGA TGACGGGAAC 
GGCGGGGATG ACGGGAAGGG CGGGGACAGC GGGGACGGCG GGGACCGGTG GTCGGCACGA 
CCGTCCCCGT CGGCGTCTTC GACCGCGACG GCGTCTTCGA CCCGGCTCGC CGGCGCACCG 
GCGGCGGCGA GCCGGCCGCG GCTGCTCACC GTCGCCGGCC TCGGAACCTC CTCGGGAGCC 
ACCGGACGTC GATCCCCGGC CCGCGGCAGC CGCGGCGCGC TCGTCACCAC CGCCGCGGAC 
GCACCCGGCC TGCATCTGCC GGCGACCCTG CTCGCCGCCG CCCCGTTCCA GGCCGCCCGC 
GGCCGGTGCG GACCCGGCCT CGTGCTGGTC CCGGCGGACC GCCGTGGCGC CGTGCGCGTC 
GGCCGGGAGG GCAACCTGGT GCTGTTCGTC GTCGATGCCA GCGGGTCGAT GGCCGCCCGC 
GCGCGGATGA CCCTGGTCAC CACGGCCGTG CTGGCCCTGC TCGTCGACGC CTACCAGCGC 
CGCGACCGGA TCGGGATGAT CACTTTCCGG GGGTCGGGAG CGGAGGTGGT GCTCGCGCCG 
ACCTCGAGCG TGGAGGTGGG CGCGGCCCGG CTGCGCGCGC TGCCCACCGG CGGGCGGACC 
CCGCTGGCCG CCGGGCTGGG CCTCGCCGGT GAGGTCCTGC GCGCCGAACG GCGCCGTGAT 
CCGACGCGGC GGGCCCTGCT CGTGGTCGTC ACCGACGGCC GGGCGACCGC CGGGGACGAC 
CCGCTGCCGG TGGCCCGCGC GCTGGTGCGC GCCGCCGGTG GCGCGGCCGG ACCGGCGACG 
GGCGGACGGG CCGGTACCGG GGGGCGTGGC GGCGGCCGGG GTGAGTTGAG CAGCGTCGTC 
GTCGACTGCG AGAACGGTTT CCTGCGCCTG GGCCTGGCCC AGCGGCTCGC GGGCGCCCTC 
GGCGGCGTCA CGATCCCGCT GGACTCCCTG CACCATCTCA CTCCCCGCGC GACGCCCCGC 
GCGACGTCCG GAAAGGTGGC CTGTTGA

Protein sequence

MVSVVSILSI LSILSAAAGA HDAPATPACL DGVDTVVSFP LSAVVGMDDL RLALLLNAVS 
PTLGGILVRG EKGTAKSTAV RGLAALLPPV TVTEGCRFSC APDAPLPDCP DGPHPAPSPS 
LTRPARLVEL PVGASEDRLT GSLDLDRALA DGVSVLRPGL LAAAHRGLLY VDEVNLLGDH 
LVDLLLDAAA FGVAHVERDG VSVRHPAVFL LVGTMNPEEG ELRPQLLDRF GLTVHVAASR 
DPAVRAEVVR RRLAFEADPA GFAATWADAE AELAARVVAA RGRLGTVRLT DAALRAVTAI 
CAGCDVDGMR ADVVLAKTAM ALAAWAGRAT VLAADIRTGA RLALPHRRRR GPFDAPGMDD 
ETLDAVLDEA LAALDERVGA EREAGECEAD EEAGEEAGGS GAGESGAGES GVPVNDARPD 
DDPPDGGGSG GAPRGDGGSH GCDGAGDGNR GAGNGGDDGN GGDDGKGGDS GDGGDRWSAR 
PSPSASSTAT ASSTRLAGAP AAASRPRLLT VAGLGTSSGA TGRRSPARGS RGALVTTAAD 
APGLHLPATL LAAAPFQAAR GRCGPGLVLV PADRRGAVRV GREGNLVLFV VDASGSMAAR 
ARMTLVTTAV LALLVDAYQR RDRIGMITFR GSGAEVVLAP TSSVEVGAAR LRALPTGGRT 
PLAAGLGLAG EVLRAERRRD PTRRALLVVV TDGRATAGDD PLPVARALVR AAGGAAGPAT 
GGRAGTGGRG GGRGELSSVV VDCENGFLRL GLAQRLAGAL GGVTIPLDSL HHLTPRATPR 
ATSGKVAC