Gene Francci3_1388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1388
Symbol
ID	3903369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1668334
End bp	1670238
Gene Length	1905 bp
Protein Length	634 aa
Translation table	11
GC content	74%
IMG OID	637878725
Product	polyprenyl synthetase
Protein accession	YP_480494
Protein GI	86740094
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0142] Geranylgeranyl pyrophosphate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.196896
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00569212
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCGCCGAC GGGGTCAGCT CCACGTCGGC CGCCCCGGGA TCGGCGGTCT CCACCTCCAC 
CCCGTACTCG CCGTCGGGCA GCATGACGGT GACCATGCCT GTCTCGCTCT GCGCCCGCAC 
GCCGTCCGGC GGTTCGCTGA AGTGCAGGTT GACGTCGCCG TCCCGGCTGC GCGCGGCGAC 
CGGACCGCGC GTGAGCTCCC GCCCGGCGAT GGTGCCATCG CGGGTGACCA GGGACAGTTC 
ACCGCCTACC CCCCACAGCG TGATTTCGCC GGCGAGCACC TCGGCCCGCA CCCGGACCCG 
TGGCGGCACG GTCAGCCTGA CCCGCACGTC GCTGGCCCGG CCGTCGATCC GCAGCGTGCT 
CCCGGCCCTC GTGAGCACGG GTACGGACCG ACCGGGACGA CGCCGCACGG TCAGCGCGAC 
GTGCACGTCC TCGCGGTCCC GCCCGGAGAT CTCGACGCGG CCGGCGGCCA CCAGAACCTC 
CACGGCGTCG ATACCGTCGA CAGTGTGAGT CAGCTCCGCG GGTGGCAGCC GCAACAGGGT 
CAATCCGCCC AGTGCGGCGG CGACCAGCAG AACGGCGACC ACGACGACGG CGGTGTCGAA 
CACGGGCACA CCGCACGGTA CCCCGGGCGC CGGCCAATCC CCGGCCACAC CACGGTGCCG 
GACCACACCA CGGTGCCGGA CCACACCACG GTGCCGGACC ACACCACGGT GCCGGACCAC 
ACCACGGTGC CGGACCACAC CACGGTGGAT GTGCGCCGGC GGGTCTCCGC CGTGTTGCGG 
CGCTTCGCCG GTTCGCGCGG AGCGCTCCTG CGCGGAATCG ACGACGATCT GATCCCGTTC 
GTCCGTATCG CCACCGAATT TCTGCTGGCG GAGGGCAAGC GGTTGCGTCC CGCCTTCTGC 
TACTGGGGGT GGCGGGGCGC GGGCGGCCCG GACTGCGACG AGATTGTGAC CGCCGCCGCC 
GCCATCGAGC TGCTGCACGC CTGCGCGCTG ATCCACGACG ACGTCATGGA CGCCTCCGAC 
ACACGGCGCG GCAGGCCGGC CGCGCACCGG CGCTTCTCCC GGGTCCACCG GACCGCCGGC 
TGGCGGGGTG ATCCCGCCGA CTTCGGCCGC TCGGCCGCGA TCCTGCTCGG CGATCTGTTC 
CTGGCCTGGG CCGACGAACT GCTCGCGGCC AGCAGGATGC CACCCGAGGC GTTGGTCCGG 
GCCTGGCCCA CCTACGGGCG GATGCGCAGC GAGCTGATGG CGGGGCAGTA CCTCGACCTC 
GTCGGCCAGG CCGAGGCCGG TCCGCACGGC GGCCTCGATC CCGGGCGGGC GGTCCGCATC 
GCCCGGTACA AGACCGCCGG TTACACGGTG GTCCGTCCCC TGCAGCTCGG CGGTCTGCTC 
GCGGGCGCGC CGCCGGACCT GTTGGCGGCC TATGCGGCGT TCGGCCTGCC GCTCGGCGAG 
GCGTTCCAAC TCCGCGATGA CCTCCTGGGC GTGTTCGGCG ATCCGGCGGT GACGGGAAAA 
CCCACCGGGG AGGATCTGCG TGACGGGCGG CCCACTGGCC TGCTGGCGCT CGCGCTGACC 
CGTGCGCAGC CGGCCGCGGC GGCCCGGCTG CGCACGCTGA TCTCCCCGCC GGTCCGGCGC 
GCCGGGCACC CTGAGGATGC GGGACAGCCC GAGAATCCCG GGTATTCCGG GGGACCCGGA 
TGTTCCCCGG GATTCGGGCC CACCGAGAAC CCCGCGGCCC GCGCCGCCCG GGTCGCCGAG 
GCCCGCGACA TCATCGCCGC AAGCGGAGCG GTGGCCGCCG CCGAGGAACG GATCGCCGCC 
CGGACCGCCA CGGCGGTCGA GGCGGCCCGA CGGGCGGATC TGGACGTCAC AACCCTCGCC 
GCCCTGACGG AACTCGCCAT GGCAGCGACT TCGCGATCAC ATTGA

Protein sequence

MRRRGQLHVG RPGIGGLHLH PVLAVGQHDG DHACLALRPH AVRRFAEVQV DVAVPAARGD 
RTARELPPGD GAIAGDQGQF TAYPPQRDFA GEHLGPHPDP WRHGQPDPHV AGPAVDPQRA 
PGPREHGYGP TGTTPHGQRD VHVLAVPPGD LDAAGGHQNL HGVDTVDSVS QLRGWQPQQG 
QSAQCGGDQQ NGDHDDGGVE HGHTARYPGR RPIPGHTTVP DHTTVPDHTT VPDHTTVPDH 
TTVPDHTTVD VRRRVSAVLR RFAGSRGALL RGIDDDLIPF VRIATEFLLA EGKRLRPAFC 
YWGWRGAGGP DCDEIVTAAA AIELLHACAL IHDDVMDASD TRRGRPAAHR RFSRVHRTAG 
WRGDPADFGR SAAILLGDLF LAWADELLAA SRMPPEALVR AWPTYGRMRS ELMAGQYLDL 
VGQAEAGPHG GLDPGRAVRI ARYKTAGYTV VRPLQLGGLL AGAPPDLLAA YAAFGLPLGE 
AFQLRDDLLG VFGDPAVTGK PTGEDLRDGR PTGLLALALT RAQPAAAARL RTLISPPVRR 
AGHPEDAGQP ENPGYSGGPG CSPGFGPTEN PAARAARVAE ARDIIAASGA VAAAEERIAA 
RTATAVEAAR RADLDVTTLA ALTELAMAAT SRSH