Gene Acid345_0119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0119
Symbol
ID	4071707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	127364
End bp	128707
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	62%
IMG OID	637982119
Product	FolC bifunctional protein
Protein accession	YP_589198
Protein GI	94967150
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.205687
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTACG AAACCGCTGT CGAAGCGCTC TACCAGCTCG GCCACGAGCT CGCGGGCACG 
CCCTCGCACA AGTTCGATCT CGCACACATG CGCGTGCTCC TCGACGCCCT CGCGCATCCC 
GAACGCCGCT TCGCCAGCGT GCTCATTGCG GGCACCAACG GCAAAGGTTC CACCGCCGCC 
ACGTTGTCTT CGATCCTTCT CGCCGCCGGA TACAAGACCG GCCTCTACAC TTCGCCGCAC 
CTCGTCAAGA TCAACGAACG ATTCCGCATC AACGGCTCGC AGGTCAATGA CGCCGAATTT 
ACCGCCGCTT ACGAGCACGT CGAAACCCTC GCCAGCGCAC TGGTCGAGAC CAAAGCGCTC 
CCGTGGCATC CCAGCTTTTT CGAGATGCTC ACCGCCATGG CCTTCGAACT CTTCGCGCGC 
GCCGGAATCC AGATCGCGGT GCTCGAAGTC GGCATGGGCG GCCGCCTCGA CGCAACCAAC 
GTCGTCGAGC CGCTGATCTC GGTCATCGCC GACATCTCGC TCGATCACCA GAAATTTCTC 
GGCAACACCA TCGCCGAAAT CGCCGCCGAA AAAGCCGGCA TCATCAAGCC CAACGGCACC 
GTCGTCACGC TGCCGCAGCA TCCCGCCGCC AACGACGTCA TCGGCCACGC GATCCTCGAT 
CATCAAGCCA AGGGCATCAG TGCGGTGAAG CACATGCCGC CGATGGCGCC CGGCTCCGCG 
GATTATCGCG ATGTCGAAGG CCGCAACCGC TATCCGCTCG AAGTGATGAA CGAAATCATC 
GAAGTTAACT CCCCGCTTCC CGGACGCCAC CAGCTCCGCA ACCTGGCGCT CGCCATCACC 
ACCGCAGAAG AACTAGCGCG CTTCGGATTC CCCGTTACGT CGAAACAGAT CGAGCAAGGC 
ATTCGCGAAA CCCGCTGGGC CGGCCGCTTC CAGGTAATCT CCGCCGAAAA GAATGCCCTA 
AAACGCGAGT TGATCTTCGA TGTCGCCCAC AACCCCGACG GCGCCTGGGC ACTCCGCTCC 
GCATTATCCG ACAAGATCGC TGAGCGTCCG CTAACCCTCG TCTTCGGCGC CATGCACGAC 
AAGGCCTTCC GCGAGATGGT GCAGATCCTC TTCCCCACCG CCCAGCAAGT CATCGTGACG 
CAAGCCAAGA ATCCCCGTGC CGCCACCACC GCCGAACTCG CCGAAGTTGC CAAGGAAGTT 
GGAACCGAAG TCGTCCAATG CGCCAGTGTC GAAGCCGCGG TTCACAAGGC CCCTGAGCTT 
ACGGCGGAAA ATGGCGTGAT CGTCGTAACC GGCTCCATCT TCGTCGTTGG CGAAGCCATG 
AACGCGCTTC AGGTAGAAAC CTAA

Protein sequence

MTYETAVEAL YQLGHELAGT PSHKFDLAHM RVLLDALAHP ERRFASVLIA GTNGKGSTAA 
TLSSILLAAG YKTGLYTSPH LVKINERFRI NGSQVNDAEF TAAYEHVETL ASALVETKAL 
PWHPSFFEML TAMAFELFAR AGIQIAVLEV GMGGRLDATN VVEPLISVIA DISLDHQKFL 
GNTIAEIAAE KAGIIKPNGT VVTLPQHPAA NDVIGHAILD HQAKGISAVK HMPPMAPGSA 
DYRDVEGRNR YPLEVMNEII EVNSPLPGRH QLRNLALAIT TAEELARFGF PVTSKQIEQG 
IRETRWAGRF QVISAEKNAL KRELIFDVAH NPDGAWALRS ALSDKIAERP LTLVFGAMHD 
KAFREMVQIL FPTAQQVIVT QAKNPRAATT AELAEVAKEV GTEVVQCASV EAAVHKAPEL 
TAENGVIVVT GSIFVVGEAM NALQVET