Gene Tbd_1914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tbd_1914
Symbol
ID	3674024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiobacillus denitrificans ATCC 25259
Kingdom	Bacteria
Replicon accession	NC_007404
Strand	-
Start bp	2009757
End bp	2010956
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	67%
IMG OID	637710613
Product	tryptophan synthase subunit beta
Protein accession	YP_315672
Protein GI	74317932
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.148244
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.536089
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTGA CTGACCTTCC CGATTCCCGC GGCCACTTCG GTCCCTACGG CGGCATTTTC 
GTTTCCGAAA CGCTGATGGC CGCGCTCGAC GCGCTGCGTG TCGAATACGA CGCGGCGTGC 
CGGGACCCCG GCTTCATGGC CGAATTCGAG TACGAACTCA AGCACTACGT CGGGCGGCCG 
AGCCCGGTCT ACCACGCCCG GCGGCTTTCG GAGGAATACG GCGGCGCGCA GATCTACCTC 
AAGCGCGAGG ATCTCAACCA CACCGGCGCG CACAAGATCA ACAACACGAT CGGCCAGGCG 
CTGCTCGCGC GCCGCATGGG CAAGAAGCGC GTCATCGCCG AGACCGGCGC GGGCCAGCAC 
GGCGTCGCGT CGGCGACCGT CGCCGCGCGC TACGGCATGG AATGCGTTGT CTACATGGGC 
GCCGAAGACG TCGCGCGACA GGCCCCCAAC GTCTTTCGTA TGAAGCTCCT CGGCGCGACC 
GTCGTGCCCG TGTCGTCGGG TTCGAAGACG CTGAAGGACG CGCTGAACGA AGCGATGCGC 
GACTGGGTGA CGAACGTCGA GTCGACCTTC TACATCCTCG GCACCGCGGC CGGCCCGCAT 
CCCTACCCGA TGCTCGTGCG CGACTTCCAG TGCGTGATCG GGCGCGAATG CATCGCGCAG 
ATGCCCGAGC TCGTCGGACG CCAGCCCGAC GCGGTCGTCG CCTGCGTCGG CGGCGGCTCG 
AACGCGATCG GAATTTTCCA TCCCTACATT CCCCATGAGA ACGTGCGCCT GATCGGTGTC 
GAAGCCGGCG GTTCGGGGGT CGCGAGCGGC AAGCACGCTG CGCCGCTGAC CGCCGGCACG 
CCCGGGGTGT TGCACGGCTT TCGCAGCTAC CTGATGCAGG ACGAGAACGG CCAGATCATC 
GAGACCCATT CGGTCTCGGC CGGCCTCGAC TATCCGGGCG TCGGCCCCGA GCACAGCTAT 
CTCAAGGACG CCGGTCGCGC CGAATACGTG CCGATCAACG ACGACGAAGC GCTCGCCGCC 
TTCCACGATC TGTGCCGCTT CGAGGGCATC ATCCCCGCGC TCGAGTCGAG CCACGCGGTG 
GCGCAGGCGA AGAAACTCGC GCCGACGATG AAGAAGGACC AGGTCATTCT GGTGAACCTC 
TCGGGGCGCG GCGACAAGGA CATCAACACC GTGGCGAAGG CGGCGGGCAT CACGCTCTGA

Protein sequence

MKLTDLPDSR GHFGPYGGIF VSETLMAALD ALRVEYDAAC RDPGFMAEFE YELKHYVGRP 
SPVYHARRLS EEYGGAQIYL KREDLNHTGA HKINNTIGQA LLARRMGKKR VIAETGAGQH 
GVASATVAAR YGMECVVYMG AEDVARQAPN VFRMKLLGAT VVPVSSGSKT LKDALNEAMR 
DWVTNVESTF YILGTAAGPH PYPMLVRDFQ CVIGRECIAQ MPELVGRQPD AVVACVGGGS 
NAIGIFHPYI PHENVRLIGV EAGGSGVASG KHAAPLTAGT PGVLHGFRSY LMQDENGQII 
ETHSVSAGLD YPGVGPEHSY LKDAGRAEYV PINDDEALAA FHDLCRFEGI IPALESSHAV 
AQAKKLAPTM KKDQVILVNL SGRGDKDINT VAKAAGITL