Gene Francci3_1208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1208
Symbol
ID	3903562
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1441752
End bp	1443089
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	72%
IMG OID	637878541
Product	FolC bifunctional protein
Protein accession	YP_480315
Protein GI	86739915
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.482446
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGTGGA ACCAGCCTGT GAAGTGGACG TACGAGTCGG CGTGGGCCGC CCTGAACAAC 
ACGGTGGATC TCGAAAAGCA GACGATGCCG GCGGGTCGGC CGGTGCCGAG CCTTGACCGG 
ATGCGGGAGC TGGCGGGCCG GCTCGGGGAT CCGCACCGGG CGGTTCCGCT GATCCACCTG 
ACCGGCACGA ACGGCAAGAC CTCGACGGCG CGGATCATCT CGGCGCTGCT GGGCGCGGCG 
GGGCTGCGGG TGGGGCTGTA CACCAGTCCG CATCTGGAGC GGGTGAACGA GCGTCTGGTC 
GTCGACGGCC GACCGATCGG CGACGAGGAG TTCGGACGCT GCGTGGGCAC CGTCCTGGAC 
GCGGCCGCCC CGATGAGTGG ACGGCCCACC TTCTTCGAGC TGCTGACGGC CACCGCCTTC 
CGATGGTTCG CCGACCTGGC CGTCGACGTC GCCGTGGTCG AAGTGGGCCT GCTCGGTCGC 
TGGGACGCCA CGAACATCGC CGACGGGCGG GTCGCGGTCG TCACCAGCAT CGGCGCTGAT 
CATCTGGACT ACGCCGGGAG TATGGCGGGC GTGGCCCGCG AGAAGGCCGG GATCGTCAAG 
CCCGGCAGTC ACCTGGTGCT CGGCGAGGTG GACCCCCGCT TCGACGACAT CTTCGCCCGG 
ACCCCGGCCA CGGACGTCCT GCGGCTGGGT CGGGACTTCG CCGCGGTCGC CGGCCACCCG 
GACGCGGCGG GTCGACGGGG CGGTTTCCGC ACCCCGCAGG CGCGCTACGA CGACGTGCGA 
CTGTCCCTGC ACGGTTCCTA TCAGGATGCC AACGCGGCGT GCGCCCTGGC CGCCGTGGAG 
ACCTTCGTCG GTCATTCCCT CCCCGACGTC GTGGTCCGGA CCGGTCTCGG GGGCGTCCGG 
GCGCCGGGAC GCCTGGAAAT CGTGCGCGCA CAGCCGCTGT GCGTGCTTGA CGGGGCGCAC 
AACCCGGCAG CGGGCGCGGC GCTCGCCCGG TCCCTGCGTG AGGAGTTCCC CGGGCGAGAG 
TGGACCGTCG TCTACGGGGC GCTGCGCGGT CACGACTACG AGGGGACTCT CGCGGAACTG 
CGCCACCAAC CGATCAGCTC GCTGATCGCC TGCGAACCGG CGTCACCGCG GGCCATCCGC 
GCCGAGCACC TGGTCTGCGC GGCGCGGGCG CGGGCGATGC CGGCCCACGC CGCATCCGAC 
GTCGGCTGCG CCGTCCGCCA CGCCCTGCGG GACGCGGCGG GGCCGGGTGG GGCGATCCTG 
GTGACCGGGT CCTTCTACCA TCTGGCTGAG GCCCGCCGGA CCCTGACCGC GCTGGACCCG 
ACGCACGGAA TGCACTGA

Protein sequence

MKWNQPVKWT YESAWAALNN TVDLEKQTMP AGRPVPSLDR MRELAGRLGD PHRAVPLIHL 
TGTNGKTSTA RIISALLGAA GLRVGLYTSP HLERVNERLV VDGRPIGDEE FGRCVGTVLD 
AAAPMSGRPT FFELLTATAF RWFADLAVDV AVVEVGLLGR WDATNIADGR VAVVTSIGAD 
HLDYAGSMAG VAREKAGIVK PGSHLVLGEV DPRFDDIFAR TPATDVLRLG RDFAAVAGHP 
DAAGRRGGFR TPQARYDDVR LSLHGSYQDA NAACALAAVE TFVGHSLPDV VVRTGLGGVR 
APGRLEIVRA QPLCVLDGAH NPAAGAALAR SLREEFPGRE WTVVYGALRG HDYEGTLAEL 
RHQPISSLIA CEPASPRAIR AEHLVCAARA RAMPAHAASD VGCAVRHALR DAAGPGGAIL 
VTGSFYHLAE ARRTLTALDP THGMH