Gene Caul_0518 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0518
Symbol
ID	5897973
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	566989
End bp	568362
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	66%
IMG OID	641561001
Product	L-serine dehydratase 1
Protein accession	YP_001682150
Protein GI	167644487
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1760] L-serine deaminase
TIGRFAM ID	[TIGR00720] L-serine dehydratase, iron-sulfur-dependent, single chain form

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.244314
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCA GCGTCTTTGA CCTCTTCAAA CGGGGCGTGG GGCCGTCCAG CTCGCATACG 
ATGGGGCCGA TGACGGCCGC CGCGCGCTTT GTCGAGGCGT TGCGCAGCGA CGAGAGCCTG 
GGGCGGGTGC GTGGCGTCAC CGTGACGCTC TATGCCTCGC TAGCCCTGAC CGGGCGCGGT 
CACGCGACCG ACCGGGCGGT GGTGCTGGGT CTGATGGGCT ATCGCCCCGC CACCCTTGAT 
CCGGACGAGG GCGATGCGGC CCTGACGCGA TCCGCGCGCG ATCCAAATTG GCGACTGGGC 
GGTGACGGAC CGCGGATCCA ATTCCTGCCC GACCGTGACA TCCTCTGGGA AAGGTTCACC 
CGCCTGCCGC TTCATCCCAA TGCGGTGCGC TTCAGTGCCT GTGGCCAGGG CGGGGATCTG 
CTGACCCAGA CCTACTACTC GACGGGCGGC GGCTTTGTGG CGACCGAGGC GGAACTGTTG 
TCAAACGCTC CAGGCGACAA CGGCGATGCG CCCTACCCGT TCGCGAGCGC GGCCGAGTTG 
ATCAGTCTCT GCGAGCGCGA TGGTCTGACG ATCGCCCAGT TGGCCATGGC CAATGAGCGC 
GCCCTCCGAT CCGAGGCCGA GATCTTGGAG GGACTCGATC AGATTTACGC CGACATGGCC 
GCCTCCATCG ACAGGGGGTT GCGGCAAGAC GGTATCCTGC CCGGAGGCTT GGCGGTGCGT 
CGTCGGGCCC TGCAGATTCA TCAAACCTTG CTGACGCGCA TCGATCGGGG CGAGCATGAC 
GCGCTCGAAG CCATCGACTG GGTCAACCTC TGGGCCATGG CGGTCAATGA GGAGAACGCC 
GCCGGAGGGC GCGTGGTCAC CGCGCCGACC AACGGCGCCG CGGGCATTGT TCCCGCGGTG 
CTACGTTACC ATGACAGCTA CCAGGGCGGC GACAAGCACA GCCGCCGCCA GTTCCTGCTC 
ACGGCGGGGA TCATCGGGGC GCTCTACAAG CAGAACGCCT CGATCTCAGG GGCGGAAGTC 
GGCTGCCAGG GCGAGGTAGG CGTGGCCTGC TCCATGGCCG CGGCTGGACT GGCGGCGGTG 
TCGGGCGCAA CGAACGCCCA GATCGAGAAC GCCGCCGAGA TCGGGATGGA GCACAATTTG 
GGGCTGACCT GCGATCCGAT CGCGGGCCTC GTCCAGATCC CGTGCATCGA GCGAAACGCC 
GTCGGCGCCA TGAAGGCGAT CGATGCCGCC CGCTTGGCGC TGTTGGGCGA TGGGGCTCAC 
CACGTCACGC TCGACCAAGT CATCGTCACG ATGAAGCGAA CGGGCGAGGA CATGAACGAA 
ATCTATAAGG AAACATCGCT GGGCGGACTG GCGGTCAACG CCGTGGCGTG TTGA

Protein sequence

MTISVFDLFK RGVGPSSSHT MGPMTAAARF VEALRSDESL GRVRGVTVTL YASLALTGRG 
HATDRAVVLG LMGYRPATLD PDEGDAALTR SARDPNWRLG GDGPRIQFLP DRDILWERFT 
RLPLHPNAVR FSACGQGGDL LTQTYYSTGG GFVATEAELL SNAPGDNGDA PYPFASAAEL 
ISLCERDGLT IAQLAMANER ALRSEAEILE GLDQIYADMA ASIDRGLRQD GILPGGLAVR 
RRALQIHQTL LTRIDRGEHD ALEAIDWVNL WAMAVNEENA AGGRVVTAPT NGAAGIVPAV 
LRYHDSYQGG DKHSRRQFLL TAGIIGALYK QNASISGAEV GCQGEVGVAC SMAAAGLAAV 
SGATNAQIEN AAEIGMEHNL GLTCDPIAGL VQIPCIERNA VGAMKAIDAA RLALLGDGAH 
HVTLDQVIVT MKRTGEDMNE IYKETSLGGL AVNAVAC