Gene Sare_3871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3871
Symbol
ID	5707465
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4406331
End bp	4407665
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	69%
IMG OID	641273292
Product	FolC bifunctional protein
Protein accession	YP_001538654
Protein GI	159039401
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000822129
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGACCGGAC ACCCCGACTT CGCCGCCGTC GAGGCTGAGC TCGCCACACG CGGGTTCACC 
CGGATGGTCT TCGAACTGGA CCGAATCGAG ACGCTGCTGG ATCTGCTCGG GAGCCCGCAG 
CGGGCGTACC CGTCGATCCA CCTCACCGGC ACCAACGGAA AGACCTCGAC GGCCCGCATG 
ATCGATTCGC TGTTACGGGC GTTCGGGCTG CACACCGGGC GGTACACCAG TCCGCACCTG 
GAGACTGTCC GGGAGCGGAT CAGCCTTGCC GGTGAACCGG TCGACGAGCA GCGCTTCGTC 
GACACCTACC GCGAGGTGGC GCCGCTGGCC CGACTCGTCG ACGAGCGGTC CGCGGAGCCC 
CTGACCTACT TCGACCTGAC CACGGCGCTG GCCTTCGCCA CGTTCGCCGA CGCCCCGGTC 
GACGTCGCGG TCGTCGAGGT GGGTCTCGGC GGGGCGGAGG ACTCGACCAA CGTGCTCCAG 
GCCGGTGTCG CGGTGTTGAC CCCGATCGGG CTCGACCACA CCGAGTGGCT CGGCGACAGG 
GTCGAGGACA TCGCGCTGCA CAAGGCGGGC ATCATCCACA AGGGCGCCAC GGTGATCTCC 
GCTGAGCAGC AGGAAGAGGC GGCGCGTCCG ATTCTCGAGC GCTGCGCCGA GGTCGGCGCG 
ACGATCGCCC GGGAGGGTGG CGAGTTCGGG GTGTTGAGCC GAGCGGTCGC CGTCGGCGGT 
CAGGTACTCA CCCTGCAGGG GCTCGGCGGT CGGTACGAGG AGATCTTCGT CCCGTTGCAC 
GGTGCCCATC AGGCGCAGAA CGCCGCGGTG GCGCTTGCGG CCGTAGAGGC GTTCCTCGGC 
GCGGGTACCC GCCGGCAGTT GGACGTCGAA ACGGTCCGGG AGGGGTTCGC GACAGTCACC 
TCGCCGGGTC GGCTGGAGCG AGTCCGTGCC GCGCCGACCG TGTTGCTCGA TGGTGCGCAC 
AACCCGCAGG GTATGGCCGC CACGGTCACC GCGTTGCAGG AGGAGTTTGC GTTCAGCAAG 
CTGGTCGCCG TCCTCGGTGT GCTCGGTGAC AAGGATGTGA CCCGTCTGCT GGAACTGCTG 
GAGCCGGTCA TCGATCAGTT GGTGGTCACC CGCAACAGTT CACCGCGGGC GATGGCGACC 
CAGGAACTGG CGACACTCGC CGCCGAGGTG TTCGGACCGG ACCGGGTGGC GGTGGCAGAG 
CAGATGCCGG ACGCCATCGA AGTGGCGGTG GCGTTGGCCG AGGAAGACGT CCCTGGTGAG 
CTGGCCGGGG TCGGCGTACT CGTCACCGGT TCGGTGGTGA CCGTGGCCGA CGCCCGCCGG 
CTGCTCAAGC GATGA

Protein sequence

MTGHPDFAAV EAELATRGFT RMVFELDRIE TLLDLLGSPQ RAYPSIHLTG TNGKTSTARM 
IDSLLRAFGL HTGRYTSPHL ETVRERISLA GEPVDEQRFV DTYREVAPLA RLVDERSAEP 
LTYFDLTTAL AFATFADAPV DVAVVEVGLG GAEDSTNVLQ AGVAVLTPIG LDHTEWLGDR 
VEDIALHKAG IIHKGATVIS AEQQEEAARP ILERCAEVGA TIAREGGEFG VLSRAVAVGG 
QVLTLQGLGG RYEEIFVPLH GAHQAQNAAV ALAAVEAFLG AGTRRQLDVE TVREGFATVT 
SPGRLERVRA APTVLLDGAH NPQGMAATVT ALQEEFAFSK LVAVLGVLGD KDVTRLLELL 
EPVIDQLVVT RNSSPRAMAT QELATLAAEV FGPDRVAVAE QMPDAIEVAV ALAEEDVPGE 
LAGVGVLVTG SVVTVADARR LLKR