Gene Ccel_0018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0018
Symbol
ID	7308941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	18289
End bp	19959
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	40%
IMG OID	643606946
Product	formate-tetrahydrofolate ligase FTHFS
Protein accession	YP_002504386
Protein GI	220927477
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG2759] Formyltetrahydrofolate synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCAAACTG ATATACAAAT TGCTCAGAGA TGTAAAATGC ATCATATTGC AGATATAGCA 
AAAAATCTCG GTATTGACAC CGAAGATATT GAGTTTTATG GTAATTATAA AGCCAAGTTA 
TCAGATAAGC TTTGGGATAA GGTTAAGAAT AAAAAGGATG GCAAGCTGGT TCTTGTAACC 
GCTATAAACC CTACTCCGGC AGGAGAAGGA AAAACCACAA CCACTGTGGG TCTTGGACAA 
GCTATGGCAA GGATAGGTAA AAATGCAGTT ATAGCTTTGA GAGAACCATC AATGGGTCCG 
GTAATGGGTA TTAAGGGAGG AGCTGCTGGA GGAGGTTACG CACAGGTTGT TCCCATGGAA 
GACATAAACC TCCACTTTAC TGGAGATATG CATGCAATAA CTGCGGCAAA TAATTTGCTT 
TCAGCTGCTA TAGACAACCA TCTTCAGCAA GGAAATATGT TGAATATTGA TTCCCGTCAA 
ATTGTCTGGA AGCGTTGCAT GGATATGAAC GACAGGGCAT TAAGAAACGT AATTGTAGGA 
CTCGGGGGAA AAATAAACGG TGTCCCAAGA GAAGACGGTT TTAACATTAC CGTCGCTTCT 
GAAATAATGG CAATTCTCTG TCTGGCACTT GATATTAAAG ATCTCAAGAA AAGGCTTGGA 
CGTATAATTA TTGGCTATAC TTACGAAGGC AAACCTGTAA CAGCCCATGA CTTAAAGGTT 
GATGGTGCAA TGACACTGCT ACTGAAGGAT GCTATTAAGC CTAACCTTGT ACAAACACTT 
GAAGGAACCC CTGCTTTAAT GCACGGCGGA CCTTTTGCAA ATATAGCTCA CGGTTGTAAT 
AGTATTTCAG CAACAAAACT TGCACTGAAA CTGAGTGACT ACGTTATTAC CGAAGCAGGC 
TTTGGTGCAG ACCTTGGTGC AGAGAAGTTT TTTGATATTA AGTGTAGATT TGCAGGATTC 
AAGCCGGATG CAGTTGTTCT TGTTGCTACA ATAAGGGCTC TAAAATATAA CGGCGGTGTA 
AGAAAAGAAG ACCTGAAAGA AGAGAATATT GACGCTTTAT CCAAGGGCTT TGCAAATGCA 
GAGAAGCATA TCGAAAATCT GAAACAGTTT GGTGTACCTG TTATGGTTGC CATTAATCAT 
TTTGATACCG ATACCGAGGC TGAAATAAAG CTGATTCAGG AAAAATGTAG TTCTCTAGGT 
GTCGAGGTCG CCTTTTCAGA TGTATTTTTA AAAGGCGGTG AAGGCGGAAT AGAGCTGGCA 
GAAAAGCTTG TGGCACTAAC AGATTCTACT GTTTCAAATT TTGCACCTAT ATATGATGAA 
AAACTCCCCA TAAAGGAAAA AGTTCAACAA ATAGTTTCAA AGATTTACGG AGGCAGAAAC 
GTTATTTATA ATGCGGCCGC AGAAAAGTCT ATTGCTAAGA TAGAAGAAAT GGGACTGGAC 
AGACTTCCTA TTTGTATGGC AAAAACTCAG TATTCTCTAT CTGATAATCC TGCACTTCTT 
GGGAGACCCC AAGACTTTGA CGTAACAGTA AAGGAAGTTC GGATTTCTGC AGGAGCCGGG 
TTTTTAGTAG TACTTACCGG AGATATTATG ACAATGCCCG GTCTGCCAAA GGTACCGGCA 
GCAGAAAGAA TTGATATAAA TGAATCGGGT GTTATTACTG GACTATTTTA A

Protein sequence

MQTDIQIAQR CKMHHIADIA KNLGIDTEDI EFYGNYKAKL SDKLWDKVKN KKDGKLVLVT 
AINPTPAGEG KTTTTVGLGQ AMARIGKNAV IALREPSMGP VMGIKGGAAG GGYAQVVPME 
DINLHFTGDM HAITAANNLL SAAIDNHLQQ GNMLNIDSRQ IVWKRCMDMN DRALRNVIVG 
LGGKINGVPR EDGFNITVAS EIMAILCLAL DIKDLKKRLG RIIIGYTYEG KPVTAHDLKV 
DGAMTLLLKD AIKPNLVQTL EGTPALMHGG PFANIAHGCN SISATKLALK LSDYVITEAG 
FGADLGAEKF FDIKCRFAGF KPDAVVLVAT IRALKYNGGV RKEDLKEENI DALSKGFANA 
EKHIENLKQF GVPVMVAINH FDTDTEAEIK LIQEKCSSLG VEVAFSDVFL KGGEGGIELA 
EKLVALTDST VSNFAPIYDE KLPIKEKVQQ IVSKIYGGRN VIYNAAAEKS IAKIEEMGLD 
RLPICMAKTQ YSLSDNPALL GRPQDFDVTV KEVRISAGAG FLVVLTGDIM TMPGLPKVPA 
AERIDINESG VITGLF