Gene P9211_11201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_11201
Symbol	folD
ID	5730557
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	1023723
End bp	1024631
Gene Length	909 bp
Protein Length	302 aa
Translation table	11
GC content	42%
IMG OID	641285488
Product	putative bifunctional methylenetetrahydrofolate dehydrogenase methenyltetrahydrofolate/cyclohydrolase
Protein accession	YP_001551005
Protein GI	159903661
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0190] 5,10-methylene-tetrahydrofolate dehydrogenase/Methenyl tetrahydrofolate cyclohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.466045
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCATA AACTTGATGG TAAGCAATTA GCTGGAGAGA TTGAGCAAAG ACTTAGTCAT 
GAGATAACTC TTTGCTTAAA AAAAGGTGTC CGCCCACCAG GGTTGGCGGT GATCCGAGTT 
GGTGATGATC CTGCCAGTCA AGTTTATGTT TCGAATAAAG AAAAGGCCTG TAGAAGGGCT 
GGTATTAAAA GTTTTGGTTG CCATCTTGAT GCAAATTCTT CTTTTCGTGA AATTGAGGAA 
CAGATTATAA AGTTGAACTC CAACCAAGAA GTGGATGGCA TTTTGTTGCA GCTTCCTCTA 
CCTATAGGAC TTGATGCAGG AAGACTTTTG AAGGTTATAG ACCCCAGGAA AGATGCTGAT 
GGACTACACA CTTTAAATTT AGGAAGATTA CTCAAGGATG AAATAGGCCC TAGATCTTGT 
ACTCCTGCTG GAGTTATGGC TTTGTTGGCT GCTAATCAGA TAGAGATTAA GGGTAAGAAC 
ACTGTTGTCA TTGGTCGTAG CATTCTCGTA GGGAAACCAA TGGCATTAAT GCTTCAGGCT 
GCGAATGCAA CTGTTACTCT TGTTCATTCT CATACAAGGG ATTTGATTGG CTTTACAAAA 
CAAGCAGAAA TACTTGTTGT GGCTGCAGGG AAGCCTCAAT TGATTGGCCT AGAGCATGTC 
AAGGAAAAAT CGGTAGTAGT AGATGTGGGA ATTCATAGGG TATTTAAGGA TCAAAACTTA 
GGAGATGCTG GCGGTTACAA GCTTTGTGGT GATGTTCGTA GAGAAGAGGT TGATGATTTT 
GTAAGTGCAA TTACACCAGT CCCTGGAGGC GTTGGCCCTA TGACTGTTGC AATGTTGCTT 
GTAAATACTG TTAATAGTTG GCAGCAGCAT TGCGACTTAT CCTTGAGTTT GGATGATTTA 
CTTCCATGA

Protein sequence

MAHKLDGKQL AGEIEQRLSH EITLCLKKGV RPPGLAVIRV GDDPASQVYV SNKEKACRRA 
GIKSFGCHLD ANSSFREIEE QIIKLNSNQE VDGILLQLPL PIGLDAGRLL KVIDPRKDAD 
GLHTLNLGRL LKDEIGPRSC TPAGVMALLA ANQIEIKGKN TVVIGRSILV GKPMALMLQA 
ANATVTLVHS HTRDLIGFTK QAEILVVAAG KPQLIGLEHV KEKSVVVDVG IHRVFKDQNL 
GDAGGYKLCG DVRREEVDDF VSAITPVPGG VGPMTVAMLL VNTVNSWQQH CDLSLSLDDL 
LP