Gene RPD_0200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0200
Symbol
ID	4020658
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	223692
End bp	225038
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	69%
IMG OID	637960379
Product	FolC bifunctional protein
Protein accession	YP_567341
Protein GI	91974682
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGCAG CGACTGCTCC GCAGCCGTCT GCTCTGGTCG GCGAGCTGCG CGCGCGACTT 
GCGCAGCTCC ATCCCGCACA GATCGATCTG ACGCTCGGCC GGATCGAACG GTTGCTGGCG 
GCGCTCGATC ATCCGCAGCG CAGGCTGCCG CCGGTGATCC ACATCGCCGG CACCAACGGC 
AAGGGCTCTA CCCTCGCCTT TCTCCGCGCC ATTCTCGAAG CCGCCGGCCT CAGCGTCCAC 
GCCTACACCT CGCCGCATCT GGTCCGCGTC AACGAAACCG TCCGTCTCGG ACGGCCGGGC 
GGCGGCGCGC TGGTGAGCGA CGATGAATTC GCCGCGGCGC TGGCGCATTG CGAGCGCGTC 
AATCAAGGCG CGCCGATCAC GCTGTTCGAG ATCGAAACCG CCGCGGCGCT GTGGCTGTTC 
GCGCAACATC CCGCCGACGT CACGCTGCTG GAAGTCGGCC TCGGTGGCCG GCTCGACGCC 
ACCAACGTGA TCGACCAGCC GCTCGCCTGT GTGCTGACCC CGATCGGCAT CGACCACACC 
GAGTTTCTCG GGCCGACGCT CGCGGACATC GCCGCCGAAA AGGCTGGCAT CATCCGCCGC 
GGTGTTCCGG TGATCGTGGC CGGGCAGCAG AACGATGCGA TGGACGTGAT CGAGCGCGAA 
GCCGAGCGGC TACGCGCGCC GCTGCACGCG CGCGGCCAGC AATGGCATGT CGAGGTCGAA 
CACGGCCGGC TCGCCTATCA GGACGACCGC GGCCTCATGG ACCTCACCGC GCCAAAACTG 
TTCGGCCGGC ACCAGATCGA CAATGCCTGG CTGGCGATCG CGACGCTGCG CGCGCAACAA 
CGCTTCACCT TTGACCAGGC CGCCTATCAG GCAGGGTTGT TGTCGGCGGA CTGGCCGGCG 
CGGATGCAGC GGCTGACGAC CGGCAGGCTG ATCGACGAAG CGCCACCCGG CAGCGAACTC 
TGGCTCGACG GCGGCCACAA TGCCGACGGC GGCCGCGTCG CCGCAGCGGC GCTCGGCGAT 
CTGGAAGAGC GGGTGTCGCG GCCGCTGGTG ATCATTGCCG GCATGATGGC CAACAAGGAC 
GCCAGCGCGT TCCTGACCAA TTTCACCGGA CTGACCCGCC ACGTCATCGC GGTGCCGATC 
CCCGATCGCG ACGGCGCGAT GCCGCCGGAA AAGCTCGCCG ACGCCGGGCG CGCGCTCGGC 
CTGCGGGTCG AACTCGCCGA TAGCGTGGAG GCGGCGCTGA GCCGGATCGC CGGCCTTGCC 
TATGAGCTGC CACCGCGCAT CCTGATCACC GGCTCGTTGT ATCTCGCCGG CCATGTACTG 
CGCCTCAACG GCACAATGCC GAGCTGA

Protein sequence

MSAATAPQPS ALVGELRARL AQLHPAQIDL TLGRIERLLA ALDHPQRRLP PVIHIAGTNG 
KGSTLAFLRA ILEAAGLSVH AYTSPHLVRV NETVRLGRPG GGALVSDDEF AAALAHCERV 
NQGAPITLFE IETAAALWLF AQHPADVTLL EVGLGGRLDA TNVIDQPLAC VLTPIGIDHT 
EFLGPTLADI AAEKAGIIRR GVPVIVAGQQ NDAMDVIERE AERLRAPLHA RGQQWHVEVE 
HGRLAYQDDR GLMDLTAPKL FGRHQIDNAW LAIATLRAQQ RFTFDQAAYQ AGLLSADWPA 
RMQRLTTGRL IDEAPPGSEL WLDGGHNADG GRVAAAALGD LEERVSRPLV IIAGMMANKD 
ASAFLTNFTG LTRHVIAVPI PDRDGAMPPE KLADAGRALG LRVELADSVE AALSRIAGLA 
YELPPRILIT GSLYLAGHVL RLNGTMPS