Gene Caul_4935 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4935
Symbol
ID	5902397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5332797
End bp	5334008
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	68%
IMG OID	641565455
Product	threonine dehydratase
Protein accession	YP_001686553
Protein GI	167648890
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01127] threonine dehydratase, medium form

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCGCA TGACTCTGAC CCTGGACCAC ATCCGCGCCG CCGCTAGCCG CCTCGCCGGC 
CAGATCGAGC GCACCCCGTG CCGCTATTCC AAAACGCTGT CGAAGATCAC CGGCGCGGAA 
GTCTGGGTGA AGTTCGAGAA CCTGCAGTTC ACGGCGGCTT ACAAGGAGCG CGGCGCGCTC 
AACAAGCTGA TGCTGCTGTC CGACGCCGAA AAGGCCAAGG GCGTCATCGC GGCCAGCGCC 
GGCAACCACG CCCAGGGCCT TGCCTATCAC GGCGCCCGCC TCGGCGTGCC GGTGACCATC 
GTCATGCCCA GGACCACCCC GTTCATCAAG GTGCAGCACA CCCGCGACTT CGGGGCGACC 
GTGGTGATCG AGGGCGAGAC CTATGACGAC GCCAACGCCC ATGCCCGCAA GCTGCAGGAA 
GAGCAGGGCC TGACCTTCGT CCATCCGTTC GACGACTACG ACATCATGGC CGGCCAGGGC 
ACCATCGCCC TGGAGATGCT GGAAGACGCC CCCGACCTGG AGATACTGCC GGTGCCGATC 
GGCGGCGGCG GCCTGATCAG CGGCGTGGCG ACGGCCGCCA AGGCGGTCAA GCCCGACATC 
CGGATCATCG GTTGCGAACC GGCCATGTAT CCATCCTTCA CCGCCAAGAT GCGCGGCGTC 
GCGGCCCATT GCGGCGGCCA GACCATCGCC GAGGGCGTGG CGGTCAAACA GGTCGGCGAG 
CTGACCTACG GCGTCGCCCG GCCGTTGATC GACGACGTGT TGCTGCTGGA AGAACCGCAC 
ATCGAGCAGG CCGTTGCGCT GTACTGCAAC GTCGAGAAGA CCATCGCCGA GGGCGCCGGC 
GCGGCCTCCC TGGCCGCCCT GCTGGCCTAC CCCGAGCGGT TCCGCGGCAA GAAGTGCGGT 
TTGATCCTCT GCGGCGGCAA CATCGACACC CGCCTGCTGG CCTCGGTGCT GACCCGCGAA 
CTGGTCCGCG CCCAGCGGCT GGTCAGCTTG CGCATCGTCG GCGACGACCG GCCGGGCCTG 
TTGTCGACCG TGGCCAACGT CATTGGCACG GCCGGCGCCA ACATCATCGA GGTCAACCAC 
AACCGCCTGG CCCTGGACGT GCCGGCCAAG GGCGCGGAGT TCGACATCAC CATCGAGACC 
CGCGACGCCC AGCACACCCA GGAGGTCATG GACGCCCTGC GCGAGAAGGG CTATCCGCCG 
CGCGCGGTGT GA

Protein sequence

MLRMTLTLDH IRAAASRLAG QIERTPCRYS KTLSKITGAE VWVKFENLQF TAAYKERGAL 
NKLMLLSDAE KAKGVIAASA GNHAQGLAYH GARLGVPVTI VMPRTTPFIK VQHTRDFGAT 
VVIEGETYDD ANAHARKLQE EQGLTFVHPF DDYDIMAGQG TIALEMLEDA PDLEILPVPI 
GGGGLISGVA TAAKAVKPDI RIIGCEPAMY PSFTAKMRGV AAHCGGQTIA EGVAVKQVGE 
LTYGVARPLI DDVLLLEEPH IEQAVALYCN VEKTIAEGAG AASLAALLAY PERFRGKKCG 
LILCGGNIDT RLLASVLTRE LVRAQRLVSL RIVGDDRPGL LSTVANVIGT AGANIIEVNH 
NRLALDVPAK GAEFDITIET RDAQHTQEVM DALREKGYPP RAV