Gene Suden_1119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Suden_1119
Symbol
ID	3763668
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfurimonas denitrificans DSM 1251
Kingdom	Bacteria
Replicon accession	NC_007575
Strand	+
Start bp	1172301
End bp	1173500
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	39%
IMG OID
Product	tryptophan synthase subunit beta
Protein accession	YP_393632
Protein GI	78777317
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00584813
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACATTC CATCAGCTTC AAAATTTGAT CCAAAAAATG GTCACTTCGG CATCTTTGGC 
GGTAGATATG TACCTGAGAC TCTTATGCCT GCACTTTTAA AACTAGAACA AGAGTATGAA 
AGTATCCGCT TTGACAAAGA TTTTTGGAGT GAAGTGGACT ACTATCTTGT AGATTATGTA 
GGTCGCCCTT CCCCGCTCTA CTATGCAAAA AATATATCTG ATGAACTTGG TGCAAAAATC 
TATCTAAAAA GAGAAGATTT AAACCATACA GGGGCACATA AAGTTAATAA CGTTATTGCT 
CAAGGTCTTA TGGCAAAACG TCTTGGATAT AAAAAAATCA TAGCTGAAAC TGGAGCTGGT 
CAACATGGAG TAGCAACTGC TACTATCTGC GCACTTCTAG ATTTAGAGTG TGAGATATTT 
ATGGGTGCAA AAGATGTAGC TCGTCAGGAA CTTAACGTTT TTCGTATGAA ACTTCTTGGT 
GCAAAAGTAA ATAGTGTCGA GAGCGGAAGC AAAACTCTAA AAGATGCTAT GAATGATGCA 
ATCCGTCACT GGGTAACAAA TGCAAGAGAT ACTTTTTACA TTATCGGAAC AGTTGCAGGT 
CCGCATCCAT ATCCTATGAT GGTTAGAGAT TTTCAAGCTA TTATCGGTTA TGAAGCAAGA 
GCACAGATAC TTAAAAAAGA GGGTCGTTTA CCAGACCATG TTATAGCATG TATAGGCGGA 
GGAAGCAACG CTATTGGTAT GTTTCAACAC TTTTTAGAAG ATAAAGAGGT TGAGTGTATT 
GGTATAGAAG CTGGCGGTCA TGGTATAGAG ACACTGGAGC ATGGATGCTC ACTTGAGAAA 
GGCAGAGCTG GAGTACTTCA TGGGCAGATG AGCTATCTTC TTCAAGATGA AGATGGGCAG 
GTTCAAGAGG CATACTCTAT CTCAGCTGGA CTTGATTATC CTGGAATTGG ACCCGAACAT 
GCGTTTCATT TTGAAAATAA AAGCGTAAGT TATAATCATG CAACAGATCA AGAAGCTCTA 
GATGCATTTG TTTGGCTCTC ACGCAAGGAG GGAATTATTC CCGCATTTGA GAGCGCACAT 
GCAGTAGCTT ACCTTAAAAA AATGCCAAAT ATAAAAAATA AACTTATCAT TGTTAACCTT 
TCAGGCAGAG GCGACAAAGA TATGATTCAA GCAAAAAATA TATTAAATTT TGATAACTAA

Protein sequence

MYIPSASKFD PKNGHFGIFG GRYVPETLMP ALLKLEQEYE SIRFDKDFWS EVDYYLVDYV 
GRPSPLYYAK NISDELGAKI YLKREDLNHT GAHKVNNVIA QGLMAKRLGY KKIIAETGAG 
QHGVATATIC ALLDLECEIF MGAKDVARQE LNVFRMKLLG AKVNSVESGS KTLKDAMNDA 
IRHWVTNARD TFYIIGTVAG PHPYPMMVRD FQAIIGYEAR AQILKKEGRL PDHVIACIGG 
GSNAIGMFQH FLEDKEVECI GIEAGGHGIE TLEHGCSLEK GRAGVLHGQM SYLLQDEDGQ 
VQEAYSISAG LDYPGIGPEH AFHFENKSVS YNHATDQEAL DAFVWLSRKE GIIPAFESAH 
AVAYLKKMPN IKNKLIIVNL SGRGDKDMIQ AKNILNFDN