Gene Caul_4979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4979
Symbol
ID	5902441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5383519
End bp	5384832
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	72%
IMG OID	641565500
Product	FolC bifunctional protein
Protein accession	YP_001686597
Protein GI	167648934
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACC ATCTCCGCGC CCACGACGCC GCGCTGGCGC GGCTGCAGGC CCTGCACCCC 
AAGCTGATCG ACCTGTCTCT GGACCGCATG CGGCGGCTGT GCACGGCCCT GGGCGAGCCC 
CAGAAGCGCC TGCCGCCGGT GATTCACGTG GCCGGCACCA ATGGCAAGGG CTCGACCGTC 
GCCTATCTGA GGGCGATGGC CGAGGCCGCC GGCCTGACGG TTCACGTCTT CACCTCGCCC 
CACCTGGTGC GGTTCGCCGA GCGCATCCGC CTGGCCGGAA CCCTGATCAC CGACGCGCAC 
CTGGCCGACG TGCTGGAACG GGTCGAGGCG GCCAATGCCG GCCTGCCGAT CACTTTCTTC 
GAGATCACCA CCGCCGCCGC CTTGCAGGCC TTTTCCGAGG TCCCGGCCGA CCTGTGCCTG 
GTCGAGGTGG GCCTGGGCGG GGTGCTGGAC GCGACCAATG TCGTCAGCCC CGTGGTCAGC 
GTCATCGCCC CGATCGACAT CGACCACCGC GAATTCCTCG GCGACACCCT GGCGGCCATC 
GCCCAGGAGA AAGCCGGGAT CATCAAGCCC AACACCCCCG TCGTCTCGGC CCGCCAGGCC 
GAAGAGGCCG AGCGGGTCGT CGAGCGCGAG GCCGACCTCT CCGAGGCGCC CCTGACCCTG 
ATGGGCCGCG ATTTCGACGC CTGGAACGAG CGCGGCCGGC TGCTGGTGCA ACTTCAGGAC 
CGCCTGCTGG ACCTGCCCGC CCCGTCCCTG CCCGGCGAGC ACCAGTTCGC CAATGCCGGC 
CTGGCCGTGG CGGCCATCCT GACCCTGAAC GACCCGCGCA TCGACGAGGC CGCCATGGCC 
CGGGGAATCG CGGCCACGAC CTGGCCGGCG CGGTTCCAGC GGCTGACGGC CGGTCCCCTG 
GCCGAACGCG CCAAGGCGGC GGACGCCGAT CTCTGGCTGG ACGGCGGCCA TAACCCCCAT 
GCCGGCCTGG CCGTGGCCCG GGCGCTGGGC GACCTGGCGG CGCGCGACGG CCGCCCGGTG 
GCGCTGATCG CCGGCCTGCT GGCCAACAAG GACGCCACCG GCTTCTTCGC GCCGTTCGCG 
TCGCTGAAGG CCCGGCTGTT TTCGGTGACG TTCGAAGGCC ACGCCGCCGC TAGCGCCGCC 
CAGACGGCGG CGGCGGCCGA GCTGGCGGGA ATTCGCGCCC ACGCCTGCGA CAGCGTGCGC 
GAGGCGCTCG ACAAGGCCCT GGCGATCGAG CCAACGCCGC ACGTGCTGAT CTGCGGCTCG 
CTCTACCTGG CCGGCGAAGT GCTGGCGATG AGCCCGGAGA CCTGGCCGGT CTAA

Protein sequence

MTDHLRAHDA ALARLQALHP KLIDLSLDRM RRLCTALGEP QKRLPPVIHV AGTNGKGSTV 
AYLRAMAEAA GLTVHVFTSP HLVRFAERIR LAGTLITDAH LADVLERVEA ANAGLPITFF 
EITTAAALQA FSEVPADLCL VEVGLGGVLD ATNVVSPVVS VIAPIDIDHR EFLGDTLAAI 
AQEKAGIIKP NTPVVSARQA EEAERVVERE ADLSEAPLTL MGRDFDAWNE RGRLLVQLQD 
RLLDLPAPSL PGEHQFANAG LAVAAILTLN DPRIDEAAMA RGIAATTWPA RFQRLTAGPL 
AERAKAADAD LWLDGGHNPH AGLAVARALG DLAARDGRPV ALIAGLLANK DATGFFAPFA 
SLKARLFSVT FEGHAAASAA QTAAAAELAG IRAHACDSVR EALDKALAIE PTPHVLICGS 
LYLAGEVLAM SPETWPV