Gene Caul_4907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4907
Symbol
ID	5902369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	5299992
End bp	5301431
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	67%
IMG OID	641565427
Product	pyridoxal-5'-phosphate-dependent protein beta subunit
Protein accession	YP_001686525
Protein GI	167648862
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID	[TIGR01137] cystathionine beta-synthase

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGACC CCGTTTTCGC CCTTCCGCCG GTCGCGAATT CCGCACTGGA CCTGATCGGC 
CACACGCCGA TGATGGAGGT CCGCAACCTC GACACCGGTC CATGCCGGCT GTTCCTCAAG 
CTCGAGAACC AGAACCCCGG CGGCTCGATC AAGGACCGCG TGGCCCGGTC GATGATCGAG 
GCGGCCGAGG CCGACGGCAG CCTCAAGCCC GGCGGGACGA TCATCGAGGC CACGGCCGGC 
AATACGGGCC TGGGCCTGGC CCAGGTAGCG ACGCTGAAGG GCTACAAGCT GATCCTGATC 
GTGCCGGACA AGATGGCTCG GGAGAAGATC TTGCACCTGC GGGCCATGGG CGTGGACGTC 
CGCCTGACCC GCAGCGACGT CGGCAAGGGC CACCCGGAAT ACTACCAGGA CATGGCCCAG 
ACCCTGGCCC AGTCGATCCC GGGCGCGATC TATGTCAATC AGTTCGAGAA CCCCGCCAAC 
CCGCTGGCCC ACGAGACGAC CACCGCGCCC GAGATCTTCG AGCAGATGGG CGGCGACATC 
GACGCGATGG TGGTCGGCGT CGGCTCGGGC GGCACCCTGA CGGGTGTCGG CCGGTTCATG 
GCCAAGCATT CGCCCAAGAC GGAAATGGTG CTGGCCGACC CGGTCGGCTC GATCCTGTGC 
GACTACGTGG CCACGGGGAC CTATGGCGAA GCCGGCTCGT GGATCGTCGA GGGCATCGGC 
GAGGACTTCA TCCCGGTCAA CGCCGAGATG GACTTCGTCA AGCACGCCTA TTCGATCAGC 
GACCGCGAGA GCGTCGACAC CGCCCGGCTG CTGCTGCGCA AGGAGGGCAT CCTGGCCGGC 
TCGTCGTCGG GCACCCTGCT GGCGGCCGCC CTGCGCTACT GTCGCGAGCA GACCGAGCCG 
AAGCGGGTGG TGACCCTGGT CTGCGACACG GGCTCCAAGT ACCTGACCAA GATGTTCAAC 
GACATGTGGC TGGCCGCCCA TGGCTTCGAC CAGCGCGAGC TGCACGGCGA CCTGCGCGAC 
CTGATCGCCA AGCGGTACGC CGACGGCGGG GTGGTGGCGA TCGGGCCGGA CGACACCCTG 
CTGACCGCCT ACAACCGCAT GCGCGGCGGC GACATCAGCC AGCTGCCGGT GGTCGATCAC 
GGCAAGCTGA TCGGCATTCT CGACGAGAGC GACATCCTGG CCGCCGTCGA GGGCGTCGAA 
GACGACGATC GCGGCCCGAA GTTCAAGACC CTGGTCGGGG CGGCGATGAC CAGGGCGGTC 
AACACCCTGC AATCGACGCA GGGCGTGGAC GCCCTGCCCG AGGTCTTCGA CCGCGACGAG 
GTCGCCCTGG TCTGCGACGG CGACGAATTC GTCGGAGTGA TCACCCGGGT GGACCTGATC 
AACCACCTGC GGATGAGCGC GCCTAGTTGT TGCGGAAATG TTCCGCCGGA GTCATTCTAG

Protein sequence

MNDPVFALPP VANSALDLIG HTPMMEVRNL DTGPCRLFLK LENQNPGGSI KDRVARSMIE 
AAEADGSLKP GGTIIEATAG NTGLGLAQVA TLKGYKLILI VPDKMAREKI LHLRAMGVDV 
RLTRSDVGKG HPEYYQDMAQ TLAQSIPGAI YVNQFENPAN PLAHETTTAP EIFEQMGGDI 
DAMVVGVGSG GTLTGVGRFM AKHSPKTEMV LADPVGSILC DYVATGTYGE AGSWIVEGIG 
EDFIPVNAEM DFVKHAYSIS DRESVDTARL LLRKEGILAG SSSGTLLAAA LRYCREQTEP 
KRVVTLVCDT GSKYLTKMFN DMWLAAHGFD QRELHGDLRD LIAKRYADGG VVAIGPDDTL 
LTAYNRMRGG DISQLPVVDH GKLIGILDES DILAAVEGVE DDDRGPKFKT LVGAAMTRAV 
NTLQSTQGVD ALPEVFDRDE VALVCDGDEF VGVITRVDLI NHLRMSAPSC CGNVPPESF