Gene Athe_1490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1490
Symbol
ID	7408149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1571151
End bp	1572449
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	35%
IMG OID	643715853
Product	FolC bifunctional protein
Protein accession	YP_002573361
Protein GI	222529479
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTATG AACAAGCTTT AGATTTTATT CATTCAACCT ATAAATTTGG TACAAAGCTT 
GGTCTTGAGA ATATAACAAA ACTTCTTGAG TTTATGGGTA ATCCTCAAAA AGGGTTAAAG 
GTTATTCACG TTGCGGGCAC GAATGGGAAA GGTTCCACAT GTGCTTTTAT AAATCAGATG 
TTGATTGAGG CAGGCTTTAG GGTGGGGCTT TATACCTCAC CCTTTCTTGA ATCTTTTAAC 
GAGAGGATAA AACTCAACAA TCAACCAATA GACAATCAAG AACTTGCCAG TATTACAGAG 
TTTGTAAAAG AAAGAATTGA AGAGTTGATA AGACAAGGTT TTTCACATCC CACAGAGTTT 
GAGGTTGTAA CTGCCATTGG TTTTGAGTTT TTTAAAAGAA AAAATGTAGA CTTTGTTGTT 
CTTGAGGTTG GACTTGGTGG AAGATTTGAT GCAACTAATG TAGTAGAAAA CCCTGAAATT 
TGCGTAATTA CATCAATAGG TTTTGATCAT ATGGACATTT TAGGTTCAAC AATTGAAAAA 
ATTGCTTTCG AGAAGGCAGG AATAATAAAG CAAAATACCA AAGTAATACT GGCACTTCAG 
CGATATGAAG AGGTAAAAGA GGTTATTTCG AAAGTGTGCA AGGAGCAAAA TGCTCAGCTA 
ATCGAGGTAG AAAGAAATTA TCATGTATTG AAGAGCACAC TGGAAGGAAT TGTTTTTGAT 
TGTGTTACTC CAAAAGGAAT TTATAAAAAT CTTGAGATTA AGCTACTTGG CACACATCAG 
GTAGAAAATG CTCTAAATTG TGTTTATGTG TATGAATGTT TGAAAGAAAA ATATGACATA 
AAAACTGAAG CGTTAATAAA AGGGCTATTG AATGCTCGCT GGAACGGTCG GTTTGAGGTT 
TTGATAGATA CACCTTTGGT TGTATTAGAT GGTGCGCACA ATGTAGATGG GATGAAAGTG 
CTTGTAGAAA ACTGCAAAAT ATACTTAAAT GATAAGAAGA TTGTGGCTGT TGTAGGAATT 
TTAAAGGACA AAGAATATGA AAAGATGATT TCGTTGATAA AGAGTGTGGC GCAAAGGGTT 
ATATTTACTC TTGTTCCTTC CCAAAAGAGA GCTTTTTCTG AAAAAGAAGC TCTTGAAATT 
TCGCATAAGT GTGGTGTTGA GTTTGTACCA GATTTCAGAG AAGCAATTAA ATATGCATTA 
GGTTTGTGTA ATGAAGATGA TGCAGTCATA ATTTGTGGTT CTTTATATCT TGTAGGGGCA 
GCAAGAGGTT TTCTGAAAAG CATGTTAAGT AGGTTGTAA

Protein sequence

MTYEQALDFI HSTYKFGTKL GLENITKLLE FMGNPQKGLK VIHVAGTNGK GSTCAFINQM 
LIEAGFRVGL YTSPFLESFN ERIKLNNQPI DNQELASITE FVKERIEELI RQGFSHPTEF 
EVVTAIGFEF FKRKNVDFVV LEVGLGGRFD ATNVVENPEI CVITSIGFDH MDILGSTIEK 
IAFEKAGIIK QNTKVILALQ RYEEVKEVIS KVCKEQNAQL IEVERNYHVL KSTLEGIVFD 
CVTPKGIYKN LEIKLLGTHQ VENALNCVYV YECLKEKYDI KTEALIKGLL NARWNGRFEV 
LIDTPLVVLD GAHNVDGMKV LVENCKIYLN DKKIVAVVGI LKDKEYEKMI SLIKSVAQRV 
IFTLVPSQKR AFSEKEALEI SHKCGVEFVP DFREAIKYAL GLCNEDDAVI ICGSLYLVGA 
ARGFLKSMLS RL