Gene SeD_A1602 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1602
Symbol	trpB
ID	6874933
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	1544335
End bp	1545528
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	56%
IMG OID	642784748
Product	tryptophan synthase subunit beta
Protein accession	YP_002215416
Protein GI	198242751
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.0886138
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACAC TTCTCAACCC CTACTTTGGT GAATTCGGCG GCATGTATGT GCCGCAGATC 
CTGATGCCTG CGCTGAACCA GCTTGAAGAG GCCTTCGTCA GCGCGCAAAA AGATCCTGAA 
TTTCAGGCGC AATTCGCCGA TCTGCTAAAA AACTACGCGG GACGCCCCAC CGCGCTGACG 
AAATGCCAGA ACATTACCGC CGGTACGCGT ACCACGTTGT ATTTAAAGCG CGAAGATTTA 
CTGCACGGCG GCGCACACAA AACCAATCAG GTACTGGGTC AGGCGCTGCT GGCCAAACGG 
ATGGGTAAAA GCGAGATTAT CGCTGAAACC GGCGCCGGTC AGCACGGCGT CGCCTCTGCG 
CTCGCCAGCG CCCTGCTGGG TCTGAAATGC CGTATCTATA TGGGTGCCAA AGACGTTGAG 
CGCCAGTCGC CGAACGTCTT CCGTATGCGT CTGATGGGCG CTGAGGTTAT CCCGGTTCAT 
AGCGGCTCCG CTACGCTAAA AGATGCCTGT AACGAGGCGC TGCGCGACTG GTCCGGTAGT 
TACGAAACCG CGCACTATAT GCTCGGCACG GCGGCAGGAC CGCATCCCTA TCCCACCATC 
GTTCGCGAGT TCCAACGCAT GATTGGCGAA GAGACGAAAG CGCAAATCCT CGACAAAGAG 
GGCCGTCTGC CAGATGCCGT TATCGCTTGC GTCGGCGGCG GCTCAAACGC TATCGGGATG 
TTTGCGGATT TTATTAATGA TACCAGCGTC GGGCTAATAG GCGTTGAACC TGGCGGTCAC 
GGTATTGAAA CCGGCGAGCA TGGCGCGCCG CTTAAACATG GTCGCGTTGG CATCTATTTC 
GGGATGAAAG CGCCGATGAT GCAAACAGCG GACGGGCAAA TTGAAGAGTC CTATTCCATT 
TCCGCCGGGC TCGATTTCCC ATCCGTTGGG CCGCAACATG CGTACCTGAA CAGCATCGGA 
CGCGCGGATT ATGTCTCCAT TACCGATGAT GAGGCGCTGG AAGCCTTCAA AACGTTGTGC 
CGCCATGAGG GAATTATCCC GGCGCTGGAA TCCTCCCACG CGTTGGCGCA CGCTCTGAAA 
ATGATGCGCG AGCAGCCGGA AAAAGAGCAA CTGCTGGTGG TCAATCTCTC TGGCCGCGGA 
GATAAAGACA TCTTTACCGT ACACGATATC CTGAAAGCGC GAGGGGAAAT CTGA

Protein sequence

MTTLLNPYFG EFGGMYVPQI LMPALNQLEE AFVSAQKDPE FQAQFADLLK NYAGRPTALT 
KCQNITAGTR TTLYLKREDL LHGGAHKTNQ VLGQALLAKR MGKSEIIAET GAGQHGVASA 
LASALLGLKC RIYMGAKDVE RQSPNVFRMR LMGAEVIPVH SGSATLKDAC NEALRDWSGS 
YETAHYMLGT AAGPHPYPTI VREFQRMIGE ETKAQILDKE GRLPDAVIAC VGGGSNAIGM 
FADFINDTSV GLIGVEPGGH GIETGEHGAP LKHGRVGIYF GMKAPMMQTA DGQIEESYSI 
SAGLDFPSVG PQHAYLNSIG RADYVSITDD EALEAFKTLC RHEGIIPALE SSHALAHALK 
MMREQPEKEQ LLVVNLSGRG DKDIFTVHDI LKARGEI