Gene Caci_1200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_1200
Symbol
ID	8332535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	1354785
End bp	1355840
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	74%
IMG OID	644954347
Product	threonine synthase
Protein accession	YP_003111966
Protein GI	256390402
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.887008
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTGGC GAGGCGTCAT CGAGGAGTAC CGACAGTGGC TGCCGGTCGA CGCCGGCACG 
CCCGTGGTCA CGCTGGGCGA GGGCGGCACG CCGCTGCTGC CCGCGCCGCG CCTGTCCGCC 
CTCACCGGGT GCGAGGTGTT CGTCAAGGTC GAGGGCATGA ACCCGACCGG CTCGTTCAAG 
GACCGCGGCA TGACCACCGC GATCTCGCTG GCCAAGCAGG CCGGCGCCGA GGCCGTGGTG 
TGCGCCTCCA CCGGCAACAC CAGCTCCTCG GCCGCCGCCT ACGCGGTGCG CGGCGGGCTC 
AAGCCGGTGG TGCTGGTGCC GGCCGGCAAG ATCGCGCTGG GCAAGCTGGC CCAGGCGCTG 
GCGCACGGCG CGACCCAGCT GCCGGTCGAG GGCAACTTCG ACGACTGTCT CCGGCTGGCC 
CGCGAGCTGG CCGCGAAGTA CCCGGTCGCG CTGGTGAACT CGGTGAACCC GGTCCGGCTG 
CACGGTCAGA AGACCGCCGC GTTCGAGGTC GTCGACGTGC TCGGCGACGC CCCGGACATC 
CACGCCCTGC CGGTCGGCAA CGCCGGCAAC ATCTCCGCGT ACTGGCTCGG GTATCAGGAG 
TACGCGAAGG AGGGTCAGGC CTCGCGCACG CCCCGCATGT TCGGCTTCCA GGCCGCCGGC 
GCCGCCCCGC TCGTGCACGG CGCGCCGGTC CCGGACCCGG ACACCATCGC CACCGCCATC 
CGCATCGGCA ACCCCGCGTC CTGGGACCTG GCGATCGCCG CGCGCGAGGA CTCCTCCGGC 
GTCATCGAGG CGGTGACCGA CGAGGAGATC CTCGCCGCGC ACCGTGTGCT CTCGGCCGAG 
GAGGGCGTGT TCGTCGAGCC GGCCTCCGCC GCCGGCGTCG CGGGCATCCT CAAGCTCGCC 
CGAGCCGGCC GCCTCGAGTC CGGCAAGCGC ATCGTGGTCA CGGTCACCGG CCACGGTCTG 
AAGGACCCCG AGTGGGCGGT CAAGGCCGCG CCGCCGCTGC CGGACGCCGT CCCGGCGGAG 
GTCGCCGCGG TCGCCGAGGC TCTCAGCCTC AGCTAA

Protein sequence

MAWRGVIEEY RQWLPVDAGT PVVTLGEGGT PLLPAPRLSA LTGCEVFVKV EGMNPTGSFK 
DRGMTTAISL AKQAGAEAVV CASTGNTSSS AAAYAVRGGL KPVVLVPAGK IALGKLAQAL 
AHGATQLPVE GNFDDCLRLA RELAAKYPVA LVNSVNPVRL HGQKTAAFEV VDVLGDAPDI 
HALPVGNAGN ISAYWLGYQE YAKEGQASRT PRMFGFQAAG AAPLVHGAPV PDPDTIATAI 
RIGNPASWDL AIAAREDSSG VIEAVTDEEI LAAHRVLSAE EGVFVEPASA AGVAGILKLA 
RAGRLESGKR IVVTVTGHGL KDPEWAVKAA PPLPDAVPAE VAAVAEALSL S