Gene TM1040_2675 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2675
Symbol
ID	4077586
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2810634
End bp	2811905
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	66%
IMG OID	638007999
Product	FolC bifunctional protein
Protein accession	YP_614669
Protein GI	99082515
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAC AGACCTCCGA TGCCATTCTC GCCCGCATGA TGGCGCTGCA CCCCAAGATC 
ATCGACCTGA CGCTGGATCG GGTCTGGCGT CTTCTGGCGG CGCTTGAGAA CCCGCAGGAC 
AAGCTGCCCC CGGTGATCCA TATCGCGGGC ACCAACGGCA AAGGCTCGAC GCAGGCGATG 
ATCCGCGCCG GGCTTGAGGG CTGGGGCAAA TCGGTGCACG CCTATACCTC ACCGCATCTG 
GCGCGCTTTC ATGAACGCAT CCGTCTGGCG GGCGATCTGA TCTCAGAGGC GCATCTCACG 
GAGGTGCTGG ACGAGTGCTA CAGCGCCAAT GGCGACGCAA GCATCACCTA TTTCGAGATC 
ACCACCGTCG CGGGGCTTCT GGCGTTTTCA CGCACACCCG CCGACTACAC CCTCCTCGAG 
GTTGGCCTTG GCGGGCGTCT GGATGCCACC AATGTCATCA CGCCCGAGGT CTCTGTAATC 
ACGCCGGTCT CGATCGATCA CGAGCAATTC CTCGGCAATA CGCTGGCCAA GATCGCAGGC 
GAGAAGGCCG GGATCATCAA ACGCGGCGTG CCCGTGGTGG TCGGCCCCCA GGCCGAAGAG 
GCGATGGAGG TCATCGAGGA CACCGCGATG CGCCTGGGCG CCCCCCTGAT CGCCTATGGC 
CAGCACTGGC ACGTCCACGA GGAACGCGGC CGTCTCGTCT ATCAGGACGA GCGCGGCCTG 
CTGGACCTGC CGCTGCCCAA CCTGATGGGC GCGCATCAGA TCCAGAACGC CGGCGCCGCC 
CTTGCGGTGC TGCGCCACCT TGGCGCGGAT GAGGCCGCCT GCGAGGCGGC TGTTGTGGGG 
GCACAGTGGC CCGCCCGTAT GCAGCGCCTC AAAACCGGCC CGCTGGTGGA AATCGCAGGC 
GCGGCCGAGC TGTGGCTCGA TGGCGGCCAC AACGCCGCTG CCGGGATTGC TCTCGCCGAT 
GTGCTGGCCA AGCTGCCCAA ACGCCCGACG CATCTGATTT GCGGTATGCT CAATACCAAG 
GATGTCACAG GCTACCTGCG CCCGCTCGCC GCCGAGGCCC AGAGCCTCAC GGCGGTGTCG 
ATCCCGGGCG AGGCGGCAAC CCTCTCGGCC GAGGAAACCA AAGCGGCGGC CAGTTCCGTG 
GACCTTCCAG CAACCACTGC GGAGTCTGTT GCCGAGGCGC TCACCGCCAT TCTGGCGCGC 
GACCCAGACA GCCGCGTGCT GATCTGCGGC TCGCTCTATC TGGCGGGCAA TATCCTGCGC 
GAGAACGGCT AG

Protein sequence

MTEQTSDAIL ARMMALHPKI IDLTLDRVWR LLAALENPQD KLPPVIHIAG TNGKGSTQAM 
IRAGLEGWGK SVHAYTSPHL ARFHERIRLA GDLISEAHLT EVLDECYSAN GDASITYFEI 
TTVAGLLAFS RTPADYTLLE VGLGGRLDAT NVITPEVSVI TPVSIDHEQF LGNTLAKIAG 
EKAGIIKRGV PVVVGPQAEE AMEVIEDTAM RLGAPLIAYG QHWHVHEERG RLVYQDERGL 
LDLPLPNLMG AHQIQNAGAA LAVLRHLGAD EAACEAAVVG AQWPARMQRL KTGPLVEIAG 
AAELWLDGGH NAAAGIALAD VLAKLPKRPT HLICGMLNTK DVTGYLRPLA AEAQSLTAVS 
IPGEAATLSA EETKAAASSV DLPATTAESV AEALTAILAR DPDSRVLICG SLYLAGNILR 
ENG