Gene MCA2219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA2219
Symbol	fhs
ID	3102111
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	2396781
End bp	2398454
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	65%
IMG OID	637171365
Product	formate--tetrahydrofolate ligase
Protein accession	YP_114639
Protein GI	53803762
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG2759] Formyltetrahydrofolate synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.83616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGATA TCGAAATCGC GCAGCGCGCC AAGATGCTGC CCATCATTGA TCTGGCCCGC 
GAGAAACTAG GAATTCCTGC CGCCAGCCTC GACCCTTACG GGCATTACAA AGCCAAGGTC 
GCGCTCGACT ACATCGACGG CCTCAAGGAC CGGCCCGACG GCAAGCTCAT CCTGGTCACC 
GCCATCAGCC CGACCCCGGC CGGCGAAGGC AAGACCACGA CCACGGTCGG CCTGGGCGAC 
GCGCTGAACC GGATCGGCAA GAAGACCGTG ATGTGCCTGC GCGAACCCTC GCTCGGCCCC 
TGCTTCGGCG TCAAAGGCGG AGCCGCGGGT GGCGGCCATG CGCAGGTGGT GCCGATGGAG 
GACATCAACC TGCATTTCAC CGGCGACTTC CACGCCGTCG GCGTCGCCCA CAACCTGCTC 
TCGGCCCTGA TCGACAACCA CATCAACCAC GGCAATGCGC TCGACATCGA CCCGCGCCGC 
ATCCAGTGGA AGCGCGTGGT CGACATGAAC GACCGCGCCC TGCGCAAGAT CGTGGTGGGC 
ATGGGCGGCA CCGCCAACGG TTATCTGCGC GAAGACGGCT TCGACATCGT GGTGGCATCG 
GAAGTGATGG CCATCCTCTG CCTGGCCACC AGCATGGCGG ACCTGAAGGA GCGGCTGGGC 
CGCATCATCG TCGGCTACAA GAGCGACGGC AAGACCCCGG TCTACGCCCG CGACCTCAAG 
GCCCACGGCG CCATGGCCGC CCTGCTGAAG GACGCCATCA AGCCGAATCT GGTGCAGACC 
CTGGAGAACA ACCTCGCCAT CATCCACGGC GGGCCGTTCG CCAACATCGC CCACGGCTGC 
AACACCGTGA CCGCCACCCA GACTGCGCTG AAGCTGGCCG ATTACGTGGT GACCGAAGCC 
GGCTTCGGCG CCGACCTGGG CGCCGAGAAG TTCATCGACA TCAAATGCCG CATGGCCGGG 
CTGAACCCCG CCGCGGTGGT GCTGGTCGCC ACGGTACGCG CCCTGAAATT CCACGGCGGC 
GTGAAAAAGG AAGACCTGAA TCAGGAAAAC CTCGCCGCGC TGGAAGCCGG TTTCGCCAAC 
CTGGAAAGGC ACGTCCACAA CATCCGCGAG CACTATGGCC TGCCCTGCGT GGTTTCGATC 
AACCATTTCA GTTTCGACAC CGAAGCCGAA ATCGCGTGGC TGATGAAGAA ATGCGAGGCG 
TTGGGCGTGA AGGCGGTCCT CGCCCGCCAC TGGGCCGAGG GCGGCAAGGG CGCGGAAGCG 
CTGGCCCGGA CGGTCGCCGA CATCGTCGAC CACCAGCCGG GCCGGCATAC TTTCGTCTAC 
GGCGACGAAG CGACGCTGTG GAACAAGATC GAGACCATCG CCACGAAAAT CTATGGCGCC 
GCCGGCATCA GCGCCGACGC CAAGGTCAAG GCCCAGCTCG AAGCGTGGAA TGCCGACTAC 
GGGCATTACC CGGTGTGCAT GGCCAAGACC CAGATGTCCT TCTCCACCGA CCCCAACGCC 
AAGGGCGCGC CGAGTGGCCA CACCGTCGCC ATCCGCGAAG TCCGCCTGGC CAACGGCGCC 
GGCTTCGTCG TCGCCATCGC CGGCGACATG ATGACCATGC CCGGCCTGCC CAAAGTCCCG 
GCGGCCGAGC ACATCGACGT CGACGACGAC GGCCGGATCA GCGGCTTGTT CTGA

Protein sequence

MSDIEIAQRA KMLPIIDLAR EKLGIPAASL DPYGHYKAKV ALDYIDGLKD RPDGKLILVT 
AISPTPAGEG KTTTTVGLGD ALNRIGKKTV MCLREPSLGP CFGVKGGAAG GGHAQVVPME 
DINLHFTGDF HAVGVAHNLL SALIDNHINH GNALDIDPRR IQWKRVVDMN DRALRKIVVG 
MGGTANGYLR EDGFDIVVAS EVMAILCLAT SMADLKERLG RIIVGYKSDG KTPVYARDLK 
AHGAMAALLK DAIKPNLVQT LENNLAIIHG GPFANIAHGC NTVTATQTAL KLADYVVTEA 
GFGADLGAEK FIDIKCRMAG LNPAAVVLVA TVRALKFHGG VKKEDLNQEN LAALEAGFAN 
LERHVHNIRE HYGLPCVVSI NHFSFDTEAE IAWLMKKCEA LGVKAVLARH WAEGGKGAEA 
LARTVADIVD HQPGRHTFVY GDEATLWNKI ETIATKIYGA AGISADAKVK AQLEAWNADY 
GHYPVCMAKT QMSFSTDPNA KGAPSGHTVA IREVRLANGA GFVVAIAGDM MTMPGLPKVP 
AAEHIDVDDD GRISGLF