Gene Sde_2828 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_2828
Symbol
ID	3968231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	3567099
End bp	3568595
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	44%
IMG OID	637921925
Product	tryptophan halogenase
Protein accession	YP_528297
Protein GI	90022470
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0000300055
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0040734
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAACAAA ATAAAATTAA AAAAGTGGTC ATCGCAGGTG GCGGCACAGC AGGTTGGATG 
GCCGCAGCGG CCATATCTAA GTTACTCGGT AAAAACCTCG ATATTAGTTT AGTGGAATCC 
GATCAGATTG CCACGGTAGG GGTGGGTGAG GCTACCATTC CCGCGTTACA AACATTCCAT 
AAGTTGTTGG GCATTAAAGA ACCGCACTTT ATGGCTGCCA CCCAAGCAAC CTTCAAACTG 
GGTATCGAAT TCAAACGTTG GAAGGATACC CAGTCGAGCT ACATTCATTC GTTTGGCGCA 
GTAGGTAAAG ATTGTTGGGC CGCAGGCTTC CAACATTTTT GGCGGCGGGG AGTAGACTTA 
GGCGTTAACC ACGATTACGG CGATTATTGC TTAGAGCTAG AAGCCGCCAA ACAAAATAAA 
TTTGCCCACC CCAATAGCGG CAATATTTTT TACGCCTACC ATTTAGATGC AACCCTGTAC 
GCTAAATATC TGCGTAAATT CAGCGAAACC TTTGGCGTAA AACGTATAAA GGGTAAAATT 
GTTGAAGTTA AAACACACTT ACATAACGAT TATATTAAAT CGTTAGTGTT AGAAAGCGGC 
CAAGAAGTAG AAGGCGATTT ATTTATAGAT TGCACAGGTT TTATTGGCCT ATTAATAGAG 
CAAACATTGC AAACCGGTTA CGAAGACTGG TCCCACTGGT TGCCCTGCGA TAGCGCAGTG 
GCAGTGCAAA CAGCAGCAAC GCAAGCGCCC ATACCTTATA CCCGCTCTAC TGCTCACGCT 
GCCGGCTGGC AGTGGCGTAT ACCGCTGCAG CATAGAGTGG GAAACGGTTT AGTGTATTGC 
AGTAAACATA TTAGCGATGA AGAAGCTAAG CAAACACTAT TAAATAATAT TGAAGGCGAA 
CTGCTAACAG AACCAAGAGT AATTAAATAT CGCACGGGCC AGCGTTTAAA ACACTGGAAT 
AAAAACTGCG TTGCATTAGG GTTGGCAAGC GGCTTTATCG AGCCTCTTGA ATCTACAAGT 
ATTCATTTAA TACAGCGCGG CATTTTGCGA CTGCTTTTTT TGTTCCCTTC GAATGGAATA 
AACGATACCG ATGTGGCTGA ATACAATCAG CAAACTAAAG CAGAGATTGA GCATATACGC 
GATTTTATTA TTTTGCATTA TCACGTAAAC CAGCGTAACG ATTCGCGGTT TTGGCGCTAC 
TGCGCAAATA TGTCTATACC CGAAACACTC GCGCACCGTA TCAGTCTATT TAAAAAATCT 
TCTCGATTTT ACCCAAAAGA CGATGAGCTA TTTGGCGAGT ATTCCTGGGT GCAAGTCATG 
TTGGGGCAGG GCATAGAGCC AGAGGGGTAT CATCCTATTG TGGATATGAT GTCTGAGGAT 
GAGCTTCATC ACTTTTTAAA AAATATTCGG AGTTCGGTTC AGCAGGCACT TGCCAGCATG 
CCGCAGCACA CCGATTACAT TCAGCAGTAT TGCAAAGCGC CACCCATACC TATCTAG

Protein sequence

MKQNKIKKVV IAGGGTAGWM AAAAISKLLG KNLDISLVES DQIATVGVGE ATIPALQTFH 
KLLGIKEPHF MAATQATFKL GIEFKRWKDT QSSYIHSFGA VGKDCWAAGF QHFWRRGVDL 
GVNHDYGDYC LELEAAKQNK FAHPNSGNIF YAYHLDATLY AKYLRKFSET FGVKRIKGKI 
VEVKTHLHND YIKSLVLESG QEVEGDLFID CTGFIGLLIE QTLQTGYEDW SHWLPCDSAV 
AVQTAATQAP IPYTRSTAHA AGWQWRIPLQ HRVGNGLVYC SKHISDEEAK QTLLNNIEGE 
LLTEPRVIKY RTGQRLKHWN KNCVALGLAS GFIEPLESTS IHLIQRGILR LLFLFPSNGI 
NDTDVAEYNQ QTKAEIEHIR DFIILHYHVN QRNDSRFWRY CANMSIPETL AHRISLFKKS 
SRFYPKDDEL FGEYSWVQVM LGQGIEPEGY HPIVDMMSED ELHHFLKNIR SSVQQALASM 
PQHTDYIQQY CKAPPIPI