Gene Dole_3059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3059
Symbol
ID	5695919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3664891
End bp	3666654
Gene Length	1764 bp
Protein Length	587 aa
Translation table	11
GC content	62%
IMG OID	641265676
Product	formate--tetrahydrofolate ligase
Protein accession	YP_001530939
Protein GI	158523069
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG2759] Formyltetrahydrofolate synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000769965
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTACG ATGCAACAAA AATGGCCGAC TGGCAGATTT CCGAGGAAGC GGAAAAGAAC 
ATGCCCATGC CCGAAGAGTG GTGTGAGAAG CTGGGACTTG AAAAGGAAGA GATGCTGGCC 
ATGGGCCGGC TGTCCAAGCT GGACTTTCTG AAGATCATCA AACGGCTGGA AGCCAAACCC 
GACGGCAAGT ACATTGAGGT GACTGCCATC ACCCCGACCC CGCTGGGAGA GGGCAAAAGC 
ACCACCTCCC TGGGCCTGAT GGAAGGCCTG GGCGCCCGGG GCAAAAGTGT GGGCGGTGCT 
CTGCGCCAGC CCTCCGGCGG CCCCACCATG AACGTCAAGG GCACGGCGGC CGGCGGCGGC 
AACTCCCTGC TGATTCCCAT GACCGAGTTC TCCCTGGGAC TGACCGGCGA CATCAACGAC 
ATCATGAACG CCCACAACCT GGGCATGGTG GCCATGACCG CCCGCATGCA GCACGAGCGC 
AATTACAACG ACGAGCAGCT TCAGCGCCTC ACCGGCATGC GCCGCCTGGA CATCGATCCC 
ACCCGCGTTG AGATGGGCTG GATCATTGAC TTCTGTGCCC AGGCCCTGCG CAACATCGTC 
ATCGGCCTCG GCGGCCGCAC CGACGGCTAC ACCATGCAGT CCAAGTTCGG CATTGCCGTG 
GGCTCCGAGC TCATGGCCAT CCTGGCCGTG GCCACCGACC TGGCCGACCT GAAGGAGCGC 
ATCAACAACA TCACCGTGGC CTTTGACAAG TCCGGCAAAC CGGTCACCTG CCGTGACCTG 
GAAGTGGGCA ACGCCATGGC CGCCTTCATG CGCAACACCA TCAACCCCAC CCTCATGAGC 
ACCGCCGAGT ACCAGCCCTG CCTGGTGCAT GCGGGTCCCT TTGCCAACAT CGCCGTGGGC 
CAGAGCTCCA TCATTGCCGA CCGCGTGGGC CTCAAGCTGT GGGACTACCA TGTCACGGAG 
TCCGGGTTTG CCGCTGACAT CGGTTTTGAA AAATTCTGGA ACGTCAAGTG CCGTTTCTCC 
GGCCTCAAGC CCCATGTGTC GGTTCTGACC GCAACCATCC GCGCACTGAA GATGCACGGC 
GGCGGCCCCA AGGTCGTGGC CGGCAAGGCC CTGGACGACG CCTACACCAA GGAGAATCTG 
GCCCTGGTGG AAAAGGGTGT CGAGAACATG GTCCACATGA TCGGCGTGAT CCGTAAATCC 
GGCATTAACC CGGTGGTCTG TGTCAACCGC TTCTACACCG ACACCGATGC TGAAGTCGCT 
ATCGTTAAGA AAGCGGCCGA GGCGGCCGGC GCCCGCTGCG CCGAGTCCAA GCACTGGGAA 
AAAGGCGGCG AAGGCGCTTT GGAATTTGCC GATGCCGTTA TTGATGCCTG TGAAGAAGGC 
AATGACTTTG ACTTCCTGTA TCCGCTGGAG ATGAAACTGC GCGACCGTGT TGATAAGATC 
GCCAGGGAAG TGTACGGCGC CGACGGCGTT GATTGGTCTC CGGAAGCCAC GGCCAAGGCC 
GAAATGCTGG AGAACGATCC CAAGTACGCC GACTTTGCCA CCATGATGGT CAAGACCCAC 
CTCTCCCTCA CCCACGACCC GGTCAAGAAG GGTGTGCCCA AGGGGTGGCG GCTGCCCATC 
CGCGACGTGC TGATTTACTC GGGCGCCAAG TTCCTGTGCC CCTGCGCAGG CACCATCAGC 
CTGATGCCGG GTACCGGTTC CAACCCGGCT TTCCGTCGCA TCGACGTTGA CCCGGCCACC 
GGCAAGGTCT CCGGCCTGTT CTAG

Protein sequence

MAYDATKMAD WQISEEAEKN MPMPEEWCEK LGLEKEEMLA MGRLSKLDFL KIIKRLEAKP 
DGKYIEVTAI TPTPLGEGKS TTSLGLMEGL GARGKSVGGA LRQPSGGPTM NVKGTAAGGG 
NSLLIPMTEF SLGLTGDIND IMNAHNLGMV AMTARMQHER NYNDEQLQRL TGMRRLDIDP 
TRVEMGWIID FCAQALRNIV IGLGGRTDGY TMQSKFGIAV GSELMAILAV ATDLADLKER 
INNITVAFDK SGKPVTCRDL EVGNAMAAFM RNTINPTLMS TAEYQPCLVH AGPFANIAVG 
QSSIIADRVG LKLWDYHVTE SGFAADIGFE KFWNVKCRFS GLKPHVSVLT ATIRALKMHG 
GGPKVVAGKA LDDAYTKENL ALVEKGVENM VHMIGVIRKS GINPVVCVNR FYTDTDAEVA 
IVKKAAEAAG ARCAESKHWE KGGEGALEFA DAVIDACEEG NDFDFLYPLE MKLRDRVDKI 
AREVYGADGV DWSPEATAKA EMLENDPKYA DFATMMVKTH LSLTHDPVKK GVPKGWRLPI 
RDVLIYSGAK FLCPCAGTIS LMPGTGSNPA FRRIDVDPAT GKVSGLF