Gene P9211_13501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_13501
Symbol	folC
ID	5730990
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	1218587
End bp	1219828
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	37%
IMG OID	641285723
Product	putative bifunctional dihydrofolate/folylpolyglutamate synthase
Protein accession	YP_001551235
Protein GI	159903891
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATTAACT TCACAGTCGA TGGCGATGAC GAAATTGAAA ACCTTCTAAG TTTATATAAG 
GCTAGAGGTA TAAGTCTTGA ATTAAATAGG ATGCAAGCAG CTCTAAAAAA TCTTGGCAAT 
CCTTACAACG AAATTCCTGC AATACAAGTT ATAGGAACAA ATGGGAAAGG TTCAATTGTA 
AGTTTTCTTG AGAGCTGCCT AAAAGAAGCA AGAATTAAAA TTGGATGTAG CACCTCTCCT 
CATCTCGTAA GCTGGCGCGA GCGAATTCGC ATTAATGGGC AAGAAATATC TTCTCAAGAC 
TTTCTGAAAA TTCTTACCAA ATTCCAAGCA ATCGCAAAAA GCTACCGCTT AACCCCATTT 
GAACTAATAA TACTTTCTGC ATTTGATTAT TTTTACAGCA ATCAAGTTGA GTTAATGGTT 
TTAGAGGTGG GGCTAGGAGG AAAACTCGAT GCAACAACAG CACATCCTTT CAGACCTTTA 
ATAGCTATTG GAGGAATTGG CTTAGACCAT TGTGAATATC TGGGAAATAC TTTAACAGCA 
ATTACTAAAG AAAAAGCCGC TGTGATTTCA TATGGAAGTA CTGTAATTAG TTCACCCCAG 
GAACCAGAAG TAAAAAGAGT TATTGAGAAA GTTGTATCTA AAAATAATGC AAGAATTATA 
TGGGTAGAGC CATTATCTAA AGATTGGGAA TTAGGTATAG CTGGTGAAAT TCAAAGAACA 
AACGCCGCAG TAGCTAAAGG AATTTTAGAA GCCTTACCAA GCTTTGGATG GGAAGTCAAT 
CAAACAACAA TTCGTAGAGG GCTGTCCCTA GCAAAATGGC CAGGAAGGCT TCAAAAAGCA 
AGCTGGGGGA ATATGCCATT AATTTTAGAT GGAGCCCATA ATGAACATGC AGCCAATCAA 
TTAGCTAAAG AACGATTGCT CTGGCCATCA GAAAGCAATG GAATTTTTTG GATTTTTGGC 
ATTCAAGCGC ATAAAGATGG TCCTGAGATA ATTAGGAAAT TGCTAAAAGT CAATGATCTT 
GGATGGGTTG TTCCAGTTCC AAATACTAAA AGTTGGAGCA AAAGTAATCT TTGCAAAACA 
TATCCTGAAA TGTCGAATCA ATTAAATGAA GCCAATAGCG TGGCAAAAGT CCTAGAGAAG 
ATTTCATCTG GAGAGATGTG TAAGGATAAA AAAACCATTG TAATAACTGG TTCCTTACTT 
CTTATAGGAA ACCTTTTAAG AAAAGACTTA CTTCTCTTTT AA

Protein sequence

MINFTVDGDD EIENLLSLYK ARGISLELNR MQAALKNLGN PYNEIPAIQV IGTNGKGSIV 
SFLESCLKEA RIKIGCSTSP HLVSWRERIR INGQEISSQD FLKILTKFQA IAKSYRLTPF 
ELIILSAFDY FYSNQVELMV LEVGLGGKLD ATTAHPFRPL IAIGGIGLDH CEYLGNTLTA 
ITKEKAAVIS YGSTVISSPQ EPEVKRVIEK VVSKNNARII WVEPLSKDWE LGIAGEIQRT 
NAAVAKGILE ALPSFGWEVN QTTIRRGLSL AKWPGRLQKA SWGNMPLILD GAHNEHAANQ 
LAKERLLWPS ESNGIFWIFG IQAHKDGPEI IRKLLKVNDL GWVVPVPNTK SWSKSNLCKT 
YPEMSNQLNE ANSVAKVLEK ISSGEMCKDK KTIVITGSLL LIGNLLRKDL LLF