Gene Swoo_3837 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Swoo_3837
Symbol
ID	6118186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella woodyi ATCC 51908
Kingdom	Bacteria
Replicon accession	NC_010506
Strand	+
Start bp	4682352
End bp	4683926
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	48%
IMG OID	641635400
Product	tryptophan halogenase
Protein accession	YP_001762191
Protein GI	170728165
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAAAC CAACACAAAA AATCGTGATT GTCGGCGGTG GAACCGCAGG CTGGATCACA 
GCAGGTTGGC TAGCGGCCCA TCACAAAGTC ACCTCGGGTA GCCCCGTTGA GGTGATCTTG 
GTTGAATCAC CTGATACTCC CTCCATTGGC GTAGGGGAAG GCACTTGGCC TACCATGCGC 
AATAGCTTGA TAAAAATGGG CATTAGTGAA ACAGACTTTA TTCGCGAGTG TGACGCCACT 
TTCAAGCAAG GAGCCAAATT TGCCAAGTGG GTCGATGGCT CAGATGATGA TTTCTACTAC 
CACCCTCTCG TGCTCCCCCA AGGCTTTACT CAGCACGACC TCGCCCCCTA CTGGGCATCG 
CTACACGCAG AATCAAATGA GGAAAGTAAA CACTCTTTCT CCAACGCAGT TTGCTTTCAA 
GAGAGCGTCT GTGAGCAGGG CTTAGCCCCT AAAACCATAC GCACCGCTGA ATACTCAGAT 
GTAGCCAACT ACGCTTATCA TCTCGATGCA GGTAAATTCT CTCAATTTCT CCAGCGTCAC 
TGCACCGAAA AGTTGGGTGT CACCTATCTC AGCGCTCATG TCACTGCCAT CAATGAACAC 
TCTAACGGTG ACATCGCCTC ATTAACCACG CAAACAACGG ACAAACTTGA AAAAGAGATA 
GAGGGCGATC TGTTTGTCGA TTGCTCAGGC TTCAAATCCC TACTCTTAGG TCAGCACTAC 
CAAATACCCT TTATCGATTG TAGCAACGTG CTCTTTATCG ACACAGCCTT AGCGGTGCAC 
GTGCCCTATG ACGAAGAGAA TAGCCCCATC GCCTCCCATA CCATCTCCAC TGCACAAGAG 
GCGGGTTGGA TCTGGGATAT CGGCTTGCAG CATCGACGAG GCGTCGGTCA TGTCTACTCC 
AGTAGATACA CAGATGAGGC TACAGCCATG CAGGCATTGG CCGATTATAT CGGTCCCAAA 
TTTGACTCAC TCACAGTGCG AAAAATCCCC ATTAAGAGTG GCCACCGTAA GACTTTCTGG 
CACAAAAACT GTGTCGCCGT GGGTCTATCA GCAGGTTTTC TTGAACCGCT AGAAGCCTCG 
GCGATTGTCC TTGTTGAACT TTCAGCACAG ATGATTAGCG AACAGCTACC CGCCAACCGT 
GAGGTGATGG ATATCGTCGC AAAACGTTTT AATCAAACCT TCAACTACCG ATGGGAGCGC 
ATCATCGACT TTCTCAAGCT GCACTACATT CTAAGTCGAC GCTGTGACAG CGACTTTTGG 
AAAGATAACC GCGACCCTAA AACGATCCCT GATAGCCTAC AAGATCTGAT GAAAGTATGG 
CAGCACAGAG CACCGGCGGA CATGGACTTC ACCAGTAATA ATGAAGTTTT CCCGGCTGCA 
AGCTACCAAT ATGTACTCTA TGGAATGGGT TTTGATACCG ATTATTCAGT CACGCCTCAT 
CTACTCAATG ACTGGCAATA TGCTCATCGA CAGTTCGCTA AAAATCAGTA TTTGATTGAG 
CGGGCTACCG TACAATTACC GAGCAATAGA GAGCTTATCA ATAAGATAAA ACAATATGGC 
TTTAGCCAAA TTTAA

Protein sequence

MDKPTQKIVI VGGGTAGWIT AGWLAAHHKV TSGSPVEVIL VESPDTPSIG VGEGTWPTMR 
NSLIKMGISE TDFIRECDAT FKQGAKFAKW VDGSDDDFYY HPLVLPQGFT QHDLAPYWAS 
LHAESNEESK HSFSNAVCFQ ESVCEQGLAP KTIRTAEYSD VANYAYHLDA GKFSQFLQRH 
CTEKLGVTYL SAHVTAINEH SNGDIASLTT QTTDKLEKEI EGDLFVDCSG FKSLLLGQHY 
QIPFIDCSNV LFIDTALAVH VPYDEENSPI ASHTISTAQE AGWIWDIGLQ HRRGVGHVYS 
SRYTDEATAM QALADYIGPK FDSLTVRKIP IKSGHRKTFW HKNCVAVGLS AGFLEPLEAS 
AIVLVELSAQ MISEQLPANR EVMDIVAKRF NQTFNYRWER IIDFLKLHYI LSRRCDSDFW 
KDNRDPKTIP DSLQDLMKVW QHRAPADMDF TSNNEVFPAA SYQYVLYGMG FDTDYSVTPH 
LLNDWQYAHR QFAKNQYLIE RATVQLPSNR ELINKIKQYG FSQI