Gene Caul_0385 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0385
Symbol	metX
ID	5897659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	424650
End bp	425801
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	68%
IMG OID	641560870
Product	homoserine O-acetyltransferase
Protein accession	YP_001682020
Protein GI	167644357
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.859111
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGAAC TCGACTTCGC GGGACCGGTG CTGGCAGAGG GCGGAACCTG GCGCTTCCCG 
CCCGATCGCC CGCTGCCGCT GGATTCTGGC GCCAAGCTGG AAAACCTCGA GATCGCCTAT 
CGCACCTGGG GCACGCTGAA TGCGGACGGC ACGAACGCCG TCCTGATCTG TCACGCCCTG 
ACCGGCGACC AGCACGTGGC CGGCAGCCAT CCCACGACCG GCAAGCCTGG CTGGTGGGCG 
CGCCTCGTCG GCCCCGGCAG GCCGCTTGAT CCGGCCAGGC ATTTCATCAT CTGTTCGAAT 
GTGGTCGGCG GCTGCATGGG ATCGACCGGT CCGGCCTCGA TCAACCCGGC CACCGGCAAG 
GTCTACGGCC TGACCTTCCC GGTGATCACC ATCGCCGACA TGGTGCGCGC CCAGGCGATG 
CTGGTCGAGG CGCTGGGCGT CCAGACCCTG CTGGCCGTGG TCGGCGGTTC GATGGGCGGC 
ATGCAGGTCC AGCAATGGGC GGCCGACTAT CCTGGCAAGC TGTTCAGCGC GGTGATCGTC 
GCCTCGGCGT CACGCCACTC CGCCCAGAAC ATCGCCTTCC ACGAGGTGGG TCGCCAGGCG 
ATCATGGCCG ATCCCGACTG GAAGGCCGGG GCCTACGCCC AGGGCAAGTC GCGCCCTGAA 
AAGGGCCTGG CCGTCGCCCG GATGGCCGCC CATATCACCT ATCTGTCCGA GCCGGCCCTG 
CAACGGAAGT TCGGCCGCGA GCTGCAGCGC GACGGCCTGT CCTGGGGTTT TGACGCCGAC 
TTCCAGGTGG AGAGCTATCT GCGCCACCAG GGCGCGACCT TCGTCGACCG CTTCGACGCC 
AATTCCTATC TCTACATCAC CCGGGCCATG GACTATTTCG ACCTGGCCGC CGCGCACGGC 
GGGGTGTTGG CCCAGGCCTT CGCCGGCGCG CGCGACGTGC GCTTCTGCGT GCTGTCGTTC 
ACCAGCGACT GGCTCTATCC GACCGCCGAG AACCGCCACA TCGTGCGGGC GCTCACCGCC 
GCCGGTTGCC GCGCGGCCTT CGTCGAGATC GAGAGCGACA AGGGCCACGA CGCCTTCCTG 
CTGGACGAGC CGGTCATGGA CGCGGCGCTG CACGGATTTC TGAGCTCGGT GGAACGGGAG 
CGGGGGCTCT AG

Protein sequence

MAELDFAGPV LAEGGTWRFP PDRPLPLDSG AKLENLEIAY RTWGTLNADG TNAVLICHAL 
TGDQHVAGSH PTTGKPGWWA RLVGPGRPLD PARHFIICSN VVGGCMGSTG PASINPATGK 
VYGLTFPVIT IADMVRAQAM LVEALGVQTL LAVVGGSMGG MQVQQWAADY PGKLFSAVIV 
ASASRHSAQN IAFHEVGRQA IMADPDWKAG AYAQGKSRPE KGLAVARMAA HITYLSEPAL 
QRKFGRELQR DGLSWGFDAD FQVESYLRHQ GATFVDRFDA NSYLYITRAM DYFDLAAAHG 
GVLAQAFAGA RDVRFCVLSF TSDWLYPTAE NRHIVRALTA AGCRAAFVEI ESDKGHDAFL 
LDEPVMDAAL HGFLSSVERE RGL