Gene Sde_2498 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_2498
Symbol
ID	3968780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	3158965
End bp	3160470
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	45%
IMG OID	637921589
Product	tryptophan halogenase, putative
Protein accession	YP_527970
Protein GI	90022143
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACAGTA AGCAAGTTAA GAAGATAGTA ATCGTAGGTG GTGGTACAGC AGGGTGGATG 
GCAGCCGCCA TGCTTGCTTG TCGCTACTCG CGAGAAGATT TAGCTATACA GCTTGTAGAG 
TCTGATGCAA TTGCTACTGT TGGAGTGGGT GAGGCTACGG TACCGGGGAT AATCCAGCTG 
CATCAGCACC TTGGTATTAA AGAAAGTGAG TTTGTAAGCG CAACCAATGC AACCTTTAAG 
CTTGGTATAG AGTTTAAAAA TTGGAGCCAG TTGGGGGCTA CCTTTTTTCA CCCCTTTGCA 
AAATACGGCG CGCCTATTGC GGGGCAGGCA TTTTTTGATT GCTGGCTGCG CTTAAAACAA 
GCGGGGTATA CGGCAAAATT AGATGAGTTT TCTTTATCTA TTGCCTTGGC AAAGGCAAAT 
AAATTTGTAC AACCCGACGA TAACGCCACC AATCAATTGG CAATGTTTGG CTACGCGTAT 
CACTTTGATG CAACGCTTTA TGCAAAGTTT TTGCGTGCCT ACGCAGAGCA ACGCGGAGTG 
CAGCGTACCG AAGGCTTAAT TACACAAACG TACTTACAGG CAGATGGCAA TATAGAATGC 
GTGGAGCTGG CAAGTGGCGA AAAAATTGCG GGCGATTTAT TTTTTGATTG CTCAGGCTTT 
CGCGGCCTAC TTATAGAAGA GGCACTGCAA ACTGGTTATC AAGATTGGAG CCATTGGCTA 
CCCTGTAATA AAGCGGTAGC AGTGCAAACA ATAAACGAAA AACCACCTAC GCCCTATACG 
CGCTCTACTG CTTTAGCCGC TGGGTGGCAG TGGACAATTC CCCTACAGAA TCGCATAGGC 
AATGGTTATG TGTTTTGCGA CCGCTATATA TCGGACGACG AAGCAATAGC CACCTTAACC 
CGTAATGTAG AACGCGAAAT GCTTACCGAG CCAAGAGTAA TAGGGTTTAA CGCCGGCGTG 
CGCAACAAGT TTTGGAATAA AAATTGTGTG GCTATTGGTT TGGCGAGTGG GTTTATCGAG 
CCATTAGAAT CCACCAGTAT TTCACTTATT CAAACCGGCG TAGAAAAAAT AATGGATGCG 
ATGCCAGCGT TGGAATACAG CGAAAATACG ATAGCTTCAA CCAACTCGTT AAATCAGCAA 
GAATATGAGC GCATACGCGA TTTTATTGTT TTGCATTACA AAGCCAGCGC CCGCGAAGAC 
AGCGCGTTTT GGCGTGATGT GCGAGAAATG GATATACCCA CAACACTACA AAATAAAATG 
AGTGCTTACT TAAAAGATGC AACATTTTTA GATTACGGCC AAGAATCTTT TAAAGATGCA 
AGTTGGCAAA CCATGTATAA CGGTTTTAAT CTTTACCCGC AAATACCTCC AAGTAATGTT 
GCTGATCTAG ATGTGCAGCA GCTAATGCTT GTGGCCGAGA AAATGCGTGC AGCTATTCAA 
GCAGGGGTGG CTCACGCACC CAGTCATGCA GAGTTTCTTT CTACACTCGC CGACGGCAAA 
TTCTAA

Protein sequence

MHSKQVKKIV IVGGGTAGWM AAAMLACRYS REDLAIQLVE SDAIATVGVG EATVPGIIQL 
HQHLGIKESE FVSATNATFK LGIEFKNWSQ LGATFFHPFA KYGAPIAGQA FFDCWLRLKQ 
AGYTAKLDEF SLSIALAKAN KFVQPDDNAT NQLAMFGYAY HFDATLYAKF LRAYAEQRGV 
QRTEGLITQT YLQADGNIEC VELASGEKIA GDLFFDCSGF RGLLIEEALQ TGYQDWSHWL 
PCNKAVAVQT INEKPPTPYT RSTALAAGWQ WTIPLQNRIG NGYVFCDRYI SDDEAIATLT 
RNVEREMLTE PRVIGFNAGV RNKFWNKNCV AIGLASGFIE PLESTSISLI QTGVEKIMDA 
MPALEYSENT IASTNSLNQQ EYERIRDFIV LHYKASARED SAFWRDVREM DIPTTLQNKM 
SAYLKDATFL DYGQESFKDA SWQTMYNGFN LYPQIPPSNV ADLDVQQLML VAEKMRAAIQ 
AGVAHAPSHA EFLSTLADGK F