Gene Rsph17029_2316 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2316
Symbol
ID	4895996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2449364
End bp	2451037
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	68%
IMG OID	640112912
Product	formate--tetrahydrofolate ligase
Protein accession	YP_001044190
Protein GI	126463076
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG2759] Formyltetrahydrofolate synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.345965
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGTCC AGACCGATAT CGAGATCGCG CGCGCCGCGC GAAAGAAGCC CATCCAGGAG 
ATCGGTGCCG GGCTCGGCAT CCCGGCCGAG GCGCTGATCC CCTACGGTCA CGACAAGGCC 
AAGGTCGGAC AGGGCTTCAT CCGCGGGCTC GAGGGTCGAC CGGACGGCAA GCTTATCCTC 
GTGACCGCGA TCAACCCCAC GCCCGCGGGC GAGGGAAAGA CCACGACGAC GGTCGGTCTC 
GGCGACGGTC TGAACCGGAT CGGCAAGAAG GCGGTCATCT GCATCCGCGA GGCCTCGCTC 
GGGCCGAACT TCGGCATGAA GGGCGGGGCG GCGGGCGGCG GGCGGGCGCA GGTCGTGCCG 
ATGGAGGACA TGAACCTCCA TTTCACCGGC GATTTCCACG CAATCACGGC GGCGCACAAC 
CTGCTGGCGG CCATGATCGA CAACCACATC TACTGGGGCA ACGCGCTGGA ACTCGACGCC 
CGGCGCATCA CCTGGCGGCG GGTGATGGAC ATGAACGACC GCGCGCTGCG CGACACGGTG 
GTGAACCTCG GCGGCGTGGC GAACGGATTT CCGCGCCAGA CGGGCTTCGA CATCACCGTG 
GCCTCCGAGG TGATGGCGAT CCTCTGCCTC GCGGACGATC TGGAGGATCT CGAACGCCGG 
CTGGGCCGGA TCGTCGTAGG CTACCGCCGC GACAAGAGCC CGGTCTATTG CCGCGACCTG 
AAGGCCGCGG GGGCGATGGC CGTGCTGCTC AAGGATGCGA TGCAGCCGAA CCTCGTGCAG 
ACGATCGAGA ACAACCCGGC CTTCGTCCAT GGCGGACCCT TCGCCAACAT CGCCCACGGC 
TGCAACTCGG TGATCGCCAC GCGCACGGCG CTGAAGCTGG CCGACTATGT CGTGACCGAG 
GCGGGCTTCG GCGCGGATCT CGGGGCCGAG AAGTTCTTCG ACATCAAGTG CCGGCTGGCG 
GGGCTGAAGC CCTCGGCCGC CGTGGTCGTG GCCACGGTCC GGGCGCTCAA GATGAACGGG 
GGCGTGGCGC GCGAGGATCT CGGGCGCGAG GATGTCGCGG CGCTCCGGCG CGGCTGCGCG 
AACCTCGGGC GGCACATCGC CAATGTGAAG GGCTTCGGCG TGCCGGTCGT GGTGGCGATC 
AACCACTTCA CCACCGACAC CGAGGCCGAG ATCGAGGCCG TGCGCGCCTA TGCGGCGGGG 
CAGGGGGCAG AGGCGTTCCT CTGCCGCCAC TGGGCGGAAG GCTCGGCCGG GATCGAGGAT 
CTGGCGCAGA AGGTGGTCGA GCTGGCCGAG ACGCCCTCGA TGTTCGCGCC GCTCTACCCC 
GACGACATGC CGCTTTTCGA GAAGATGGAG ACCGTGGCAC GTCGCATCTA TCACGCACAT 
GACGTGATTG CCGACCATGT GATCCGCGAC CAGCTGCGAA CATGGGAGGA AGCGGGATAC 
GGGGCGCTGC CGGTATGCAT GGCCAAGACG CAATACAGCT TCACGACCGA TGCGGCGATC 
CGGGGCGCGC CCGAGGGGCA CTCCATTCCC ATCCGCGAGG TGAGGCTGGC GGCCGGCGCG 
GGATTCGTCG TCGCGATCTG CGGCGAGATC CGCACCATGC CGGGCCTGCC GAGCCAGCCC 
GCGGCCGAAC TTATCCATCT GGACGAAGAG GGACGGATCG AAGGCCTCTT CTGA

Protein sequence

MAVQTDIEIA RAARKKPIQE IGAGLGIPAE ALIPYGHDKA KVGQGFIRGL EGRPDGKLIL 
VTAINPTPAG EGKTTTTVGL GDGLNRIGKK AVICIREASL GPNFGMKGGA AGGGRAQVVP 
MEDMNLHFTG DFHAITAAHN LLAAMIDNHI YWGNALELDA RRITWRRVMD MNDRALRDTV 
VNLGGVANGF PRQTGFDITV ASEVMAILCL ADDLEDLERR LGRIVVGYRR DKSPVYCRDL 
KAAGAMAVLL KDAMQPNLVQ TIENNPAFVH GGPFANIAHG CNSVIATRTA LKLADYVVTE 
AGFGADLGAE KFFDIKCRLA GLKPSAAVVV ATVRALKMNG GVAREDLGRE DVAALRRGCA 
NLGRHIANVK GFGVPVVVAI NHFTTDTEAE IEAVRAYAAG QGAEAFLCRH WAEGSAGIED 
LAQKVVELAE TPSMFAPLYP DDMPLFEKME TVARRIYHAH DVIADHVIRD QLRTWEEAGY 
GALPVCMAKT QYSFTTDAAI RGAPEGHSIP IREVRLAAGA GFVVAICGEI RTMPGLPSQP 
AAELIHLDEE GRIEGLF