Gene BURPS1106A_A2303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2303
Symbol	folC
ID	4905274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2281841
End bp	2283208
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	68%
IMG OID	640145408
Product	FolC bifunctional protein
Protein accession	YP_001076336
Protein GI	126456914
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.966782
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTTTTTTG GCGTATTCGC CTCGATGCGC CGCTTTGATT CGAAGTTGGA TTCGATGAGC 
ACTTTTCCCA CTCTCGACGC GTGGCTTTCG CACCTCGAAA GCGCGCACCC CGTCGGCATC 
GACATGGGCC TCGCCCGCAT CGGCCAGGTC AAGGACGCGC TGAAGCTCGC ATTCGCGTGC 
CCGGTGATCA CGGTCGGCGG CACGAACGGC AAGGGCTCGA CCTGCGCGTT CATCGAGACG 
ATCCTCGTAC GCGCGGGCTA CAAGGTCGGC TGCCACACGT CGCCGCACCT GCTGCGCTTT 
AACGAGCGCG CGCGCCTCGA CGGGCGGATC GTCGACGACG AGGAACTGCT GCCGCACTTC 
GAGGCGGTCG AGGCGGCGCG CACGAGCCTG CCGGAGGCGG TGTCGCTCAC GTACTTCGAG 
TTCACGACGC TCGCGATCAT GCATTTGTTC GCATCGCGCG GGCTCGACGC GGTGATTCTC 
GAAGTGGGGC TCGGCGGCCG GCTCGACGCG GTCAACGTGA TCGACGCCGA TTGCGCGATC 
GTGACGAGCA TCGACGTCGA CCACATCGAA TATCTCGGCG ACACGCGCGA GAAGATCGCG 
TTCGAGAAGG CGGGCATCTT TCGGCCGGGC AAGCCCGCGA TCTGCGGCGA CCCGGCGCCG 
CCGCAGACGC TCGTCGACCA CGCGGGCGCG ATCGGCGCGG ATCTGTGGCT CGTCGGGCGC 
GATTTCCGCT TCTCGACGCA GCCGGGCAGC GAGCGCCAGC AGTGGACGTA CGCCGGCCGC 
GACAAGCGCT ATCCGGCGCT CGCGTATCCG GCGCTGCGCG GCGCGAACCA GTTGCTCAAC 
GCGTCGGCGG CGCTCGCCGC GCTCGAGGCG CTGCGCGAGC GGCTGCCCGT GTCCGCGCAG 
GACATCCGGC TCGGGCTCGC GAACGTCGAG CTGCCGGGGC GCTTCCAGGT GCTGCCCGGC 
AAGCCGCTCG TGCTGCTCGA CGTCGCGCAT AACCCGCACG CGGCCGCGGT GCTCGCGCAG 
AACCTCGATT CGATGGGCTA CTACCCGTAC ACGCACGCGG TGTTCGGCGC GATGGCCGAC 
AAGGATCTCG CGGGAATCGT CGAGCGGCTG AAGGGCGCGA TCGATCACTG GCATCTGACC 
GATTTGCCGC TGCCGCGCGC GGCAGCGGCC GACGTGCTCG AGCGCGTGCT GCGCGGCGCG 
GGCGTCGAGC ACGGCGCGCA GCACAACATC ACGCGCCATG CGGGCCCGGC CGATGCATTC 
CTCGATGCAC TAAAAAGCGC ATCCGACAAT GATAGAATCG TGGTTTTCGG TAGCTTCTAC 
ACGGTAGCGG GCGTGATGCC CGTCGTGGAC CGCCGCCATG ACCACTGA

Protein sequence

MFFGVFASMR RFDSKLDSMS TFPTLDAWLS HLESAHPVGI DMGLARIGQV KDALKLAFAC 
PVITVGGTNG KGSTCAFIET ILVRAGYKVG CHTSPHLLRF NERARLDGRI VDDEELLPHF 
EAVEAARTSL PEAVSLTYFE FTTLAIMHLF ASRGLDAVIL EVGLGGRLDA VNVIDADCAI 
VTSIDVDHIE YLGDTREKIA FEKAGIFRPG KPAICGDPAP PQTLVDHAGA IGADLWLVGR 
DFRFSTQPGS ERQQWTYAGR DKRYPALAYP ALRGANQLLN ASAALAALEA LRERLPVSAQ 
DIRLGLANVE LPGRFQVLPG KPLVLLDVAH NPHAAAVLAQ NLDSMGYYPY THAVFGAMAD 
KDLAGIVERL KGAIDHWHLT DLPLPRAAAA DVLERVLRGA GVEHGAQHNI TRHAGPADAF 
LDALKSASDN DRIVVFGSFY TVAGVMPVVD RRHDH