Gene Caul_0654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0654
Symbol
ID	5898109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	721018
End bp	722406
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	72%
IMG OID	641561136
Product	L-serine dehydratase 1
Protein accession	YP_001682285
Protein GI	167644622
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1760] L-serine deaminase
TIGRFAM ID	[TIGR00720] L-serine dehydratase, iron-sulfur-dependent, single chain form

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.344045
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.592232
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGCCT CCGTCTTCGA CCTGTTCAAA CTGGGCGTCG GTCCGTCGAG CAGCCACACC 
ATGGGGCCGA TGACGGCCGC CGGGCTGTTC GTCGGGCGCC TGCGCGACGC CGGAAAGCTG 
GCGCGCACGG CCCGGGTCGA GACCCGGCTC TACGCCTCCC TGGCCCTGAC CGGCCGGGGC 
CACGCCACCG ACCGGGCGGT GATCCTGGGG CTGATGGGGT TCGTGCCCGC CACGCTGGAT 
CCCGACGCCG GCGAGACGGC TCTGGCGCAG GCCGCCGCCA ACCAATGGAT CCAACTGGGG 
GGCGAGGTCG GGATCAAGTT CGACGCCGAG CGCGACATCG CCTGGGCCGG CCACGAGCGC 
CTGCCCCAGC ACCCCAACGG GCTGTCCTTC ACCGCTTTCG ACGCCGCTGG CGCCGTACTG 
GCCGAACGCA CCTATTTCTC GATCGGCGGC GGCTTCGTGC GCGACGAGAG CGAGATGGGC 
CGCAACGCCC CGCCGGAGGA CGGACCGGAG ATCCCGCATC CGTTCGAGTC CGGCGCCGAC 
CTGCTGCGGC GGGCCGCCGA CACCGGCCTG TCGATCGCCG GGGTCATGGG CGCCAACGAA 
CTGGCCCGCA TGGACCAGGC CGAGCTCGAC GCGGGCCTCG ACCGCATCTT CGCGGCCATG 
GAGGCCTGCA TCGACCGGGG CATGCGCGAG ACCGGCGTCC TGCCCGGCGG CCTGAACGTC 
AAGCGCCGGG CCCGCCAGAT CCACCAGACC ATCCAGGGCC GCATGGAGCG CCAGATCAGC 
GACCCATTGG CGGCCATGGA CTATGTCAAC CTGTGGGCCA TGGCGGTCAA CGAGGAGAAC 
GCCGCCGGCG GCCGGGTGGT CACCGCCCCC ACCAACGGCG CGGCCGGGCT GATCCCGGCG 
GTGCTGCGGT TCTTCGTGCG CTTCCACAAC GGCGCGCCGG GCCAGATCCG GGTGTTCCTG 
CTGACGGCGG CGGCGATCGG CGCGCTCTAC AAGCGCAACG CCTCGATCAG CGGCGCCGAG 
GTCGGCTGCC AGGGCGAGGT CGGCGTGGCC TGCTCGATGG CGGCGGCGGG GCTGGCGGCG 
GCCCTGGGCG CCACCAACGA CCAGATCGAG AACGCCGCCG AGATCGGCAT GGAGCACAAT 
CTGGGCCTGA CCTGCGACCC GATCGGCGGC CTGGTCCAGA TCCCCTGCAT CGAGCGCAAC 
GCCATGGGCG CGATCAAGGC CATCGACGCC GCGCGCCTGG CGCTGCTGGG GGACGGGCAG 
CACTCGGTGT CGCTGGACAA GGTGATCGCC ACGATGAAGC GCACCGGCGA GGACATGAGC 
GAAATCTACA AGGAGACCTC GCTGGGGGGC TTGGCGGTGG GGCTGTCGGT GAACCGGGTG 
GAATGCTGA

Protein sequence

MTASVFDLFK LGVGPSSSHT MGPMTAAGLF VGRLRDAGKL ARTARVETRL YASLALTGRG 
HATDRAVILG LMGFVPATLD PDAGETALAQ AAANQWIQLG GEVGIKFDAE RDIAWAGHER 
LPQHPNGLSF TAFDAAGAVL AERTYFSIGG GFVRDESEMG RNAPPEDGPE IPHPFESGAD 
LLRRAADTGL SIAGVMGANE LARMDQAELD AGLDRIFAAM EACIDRGMRE TGVLPGGLNV 
KRRARQIHQT IQGRMERQIS DPLAAMDYVN LWAMAVNEEN AAGGRVVTAP TNGAAGLIPA 
VLRFFVRFHN GAPGQIRVFL LTAAAIGALY KRNASISGAE VGCQGEVGVA CSMAAAGLAA 
ALGATNDQIE NAAEIGMEHN LGLTCDPIGG LVQIPCIERN AMGAIKAIDA ARLALLGDGQ 
HSVSLDKVIA TMKRTGEDMS EIYKETSLGG LAVGLSVNRV EC