Gene Sde_3053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_3053
Symbol
ID	3967658
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	3905506
End bp	3907032
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	45%
IMG OID	637922150
Product	tryptophan halogenase, putative
Protein accession	YP_528522
Protein GI	90022695
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00102959
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAGTTA AAAAAGTAGA ATCCATACTT GTTGTGGGTG GTGGTACAGC TGGCTGGTTA 
ACCGCAGGCA TTATTGCGGC AAAGCATGGT ACTTCGGTAT CCATAACCGT TGTGGAGTCA 
CCCAACATTA AAACGGTGGG GGTAGGCGAA GGTACTTGGC CCACAATGAA AACAACCCTG 
CAAGAAATGG GCGTTTCAGA AACAGACTTT CTAAGGCAAT GTGATGCATC GTTCAAACAG 
GGCGCGAAAT TTTGCCAGTG GAAAACTGGC GAGCAATCAG ACTACTACTA TCACCCGCTA 
ATGCTACCGC GCGATTTCGA CGAATTTAAT AGCGCACCTT TCTGGCTCGA CCAAAAAAGC 
GGAGAATCCT TCTCTAACAG CGTGTGTTTT CAGCAAGCTT TATGCGAAAA AAACCTTGCG 
CCTAAAACAT TAACAATGCC CGAATACGCA GGCGCTGCAA ATTATGCCTA CCATTTAGAC 
GCGGGCAAAT TTGCACCGTT TTTAACACAC CACTGCACAA AAAAATTAAA CGTTACCCAC 
GTTAAAGCCA CTGTAGAAAA TGTAAAACTA ACAGATAGCG GCGAAATAGA TTACCTACTA 
ACAAAAGAAG CAGGCCAACT TGAGGCCGAC CTTTATATAG ATTGCTCTGG CTTTTGTTCA 
CTACTATTAG GGCAAGCGCT AGATGTGCCC TTTGTAGATA AGAGCGATAT TTTATTTTTA 
GATACAGCCA TAGCCACTCA CGTACCCTAC CCAACTGAAA ATTCAGCTAT TGCTCCCCAC 
ACCCTTTCTA CCGCCCAAAC AAGTGGGTGG ATATGGGATA TAGGCCTGCA AAGCAGACGC 
GGCGTAGGCC ATGTTTACTC TAGTAAGTAC ATCGATGATC AAACAGCAAA GCAGCAATTG 
GCCGACTACC TGTGCACCGA TGTGCAATCG CTAGAAACCA AAACAATTCC TATGCCCTGC 
GGTCACCGAG AGAAGTTTTG GCAAAAAAAC TGCGTAGCCA TTGGCCTAGC CGCTGGTTTT 
TTAGAGCCAC TAGAAGCATC CGCTTTAGTA CTGGTGGAAA TGTCTGCCCA ATTTATTCGC 
GACCAGTTAC CCGCGCACAC CAGTATTATG CCTATTGTTG AAAAACGCTT TAACACCACC 
TTTCACTACC GCTGGCAGCG TATTATCGAC TTTTTAAAAT TACACTATGT GCTTAGCCAA 
CGACGCGACT CCGAATTTTG GTGTGCACAG CAAGATGCAT GCTCCATACC CGAATCCCTA 
CAAGAACTAT TAAACCTATG GCAATATCAA CCCCCGTGGC GCCACGATTT TCTGCACAAA 
GATGAAGTTT TCCCCGCGGC AAGCTATCAA TATGTACTTT ACGGCATGGG TTTTAAAACA 
CATTGCAGAG AAGACGAAGT AAACAAAGCG CGCTACCAGC AGCTACTAGA AGAAACAAGC 
TTCACCAAAC ATCGCGCTAT TAAAGCCCTA CCGCCAACAC GTGAGTTGCT AAACACATTA 
CATCAACACC GCATGCAGGT AATTTAA

Protein sequence

MKVKKVESIL VVGGGTAGWL TAGIIAAKHG TSVSITVVES PNIKTVGVGE GTWPTMKTTL 
QEMGVSETDF LRQCDASFKQ GAKFCQWKTG EQSDYYYHPL MLPRDFDEFN SAPFWLDQKS 
GESFSNSVCF QQALCEKNLA PKTLTMPEYA GAANYAYHLD AGKFAPFLTH HCTKKLNVTH 
VKATVENVKL TDSGEIDYLL TKEAGQLEAD LYIDCSGFCS LLLGQALDVP FVDKSDILFL 
DTAIATHVPY PTENSAIAPH TLSTAQTSGW IWDIGLQSRR GVGHVYSSKY IDDQTAKQQL 
ADYLCTDVQS LETKTIPMPC GHREKFWQKN CVAIGLAAGF LEPLEASALV LVEMSAQFIR 
DQLPAHTSIM PIVEKRFNTT FHYRWQRIID FLKLHYVLSQ RRDSEFWCAQ QDACSIPESL 
QELLNLWQYQ PPWRHDFLHK DEVFPAASYQ YVLYGMGFKT HCREDEVNKA RYQQLLEETS 
FTKHRAIKAL PPTRELLNTL HQHRMQVI