Gene Swoo_3657 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Swoo_3657
Symbol
ID	6117991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella woodyi ATCC 51908
Kingdom	Bacteria
Replicon accession	NC_010506
Strand	-
Start bp	4455426
End bp	4456910
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	45%
IMG OID	641635208
Product	sulfatase
Protein accession	YP_001762014
Protein GI	170727988
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000376885
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0602445
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATCG GAATTGTCAT CATCCTGTTG TTATTCATGG TTGGTTGTCA GGCCACAGAG 
GGCGATAAGG TTTCAAAAGA GATAGCAAAG CAGCCCAATA TTCTGTGGAT CTATGTGGAA 
GATATGAATG ACTGGATGGG GGCTTATGGT GACAAGACTG TACCGACGCC AAATATTGAT 
CAGCTTGCGA GCCAAGGGGT ACGCTTTGAT AAGGTGATAA TGCCAGCAGC AGTTTGTTCT 
GCTGTCCGCT CCGCCATTAT TTCTGGTGAG ATGCAAACCA CTTTAGGTTT CCATAACCAT 
CGTAGTGGCC GATTCGACTA TAACCCTATT GCTTTACCCC AAGGTCATAA AACGGTACCT 
GAGCTATTTC GCGATAACGG TTACGAAACC TTTAATATTG GTAAGGATGA TTACAACTTT 
CACTACGATC GCAGCCAATT ATACTCTCTA CATCCAGGCC CGATAGCCGG TCATCAAGGG 
GCAAAAAATG GTCCAGATTT CGATTGGGGT AAAAGACTAG CTCAATCTGG TAAGCCTTTC 
TTTGGTCAGA TCCAGTTACG TGGCGGGAAA TATAAAGTCA AGAACCCCCC TGTTAAAGTC 
GATCGCGCCA GCGTGACGCT TCCGCCTTAC TATAATGATC AACCTTTAAC TCGCGACGCT 
TGGGCGCGCC ACTATGAGAA TATCCATCTG ACAGATCTTG ATGTGGGAGA GATAGTTAAA 
GAGCTCAAAG ATAATAACCT ACTGGAAAAT ACAATCGTAT TCTTCTTTAC TGATCACGGC 
ATGGGACTGT TGAGACATAA GCAGTTCCTC TATGACGGTG GCCTTCAAGT TCCTTTAGTG 
ATCAGCTGGA TGAATGGTAA CGACAAGTTA CGTGAGCTAG GAGCTGAGCG TAAGGAGTTG 
ATCCGCGGTC TTGATATTGG TGGTAGTAGC TTAGGCCTTG CCGGTATCGA TATTCCAGCA 
TATATGACAA CTGAAAACTT CTTTGCTGCA GACTACCAAG CTAAGCCTTG GGTTATCTCT 
GCTCGAGATC GCTGTGACTA TACCTTTGAA AAGATGCGTT CAGTGCGCAC CGACAGGTTT 
AAATATATCC GAAATTACTT CCCCGAACGT CCCTATATGC AAGCGCAGTA CCGTGATAAA 
TGGCCTCTGG TAAAGGAGTA TAAAAAAGCC TTCGCAGCTG GAGAGTTTAA TGAGATTGAG 
GCGCAGTTAA TGGCTGAGCG TAAGCCTGCT GAAGAGTTAT ATGATTTGGA TAATGACCCC 
CATGAAGTCA GTAATTTAGC GGGTGTTGGG GCCTATAAAA GTCAATTAAC CAAGATGCGT 
GGAATTCTAA ATAACTGGGT TAAGGAGACG GGTGATAAAG GTCAGCTCCC TGAGTCCGAT 
AATGGTATCC GAGAGGTGCT GGATTTCTAC CATGACAAAT GCCAAAGCCC AGAGTGCCAA 
AGCTACCGTA CCCGCCATCA GTTAAGTGGC AATAAGAGTA AATAG

Protein sequence

MRIGIVIILL LFMVGCQATE GDKVSKEIAK QPNILWIYVE DMNDWMGAYG DKTVPTPNID 
QLASQGVRFD KVIMPAAVCS AVRSAIISGE MQTTLGFHNH RSGRFDYNPI ALPQGHKTVP 
ELFRDNGYET FNIGKDDYNF HYDRSQLYSL HPGPIAGHQG AKNGPDFDWG KRLAQSGKPF 
FGQIQLRGGK YKVKNPPVKV DRASVTLPPY YNDQPLTRDA WARHYENIHL TDLDVGEIVK 
ELKDNNLLEN TIVFFFTDHG MGLLRHKQFL YDGGLQVPLV ISWMNGNDKL RELGAERKEL 
IRGLDIGGSS LGLAGIDIPA YMTTENFFAA DYQAKPWVIS ARDRCDYTFE KMRSVRTDRF 
KYIRNYFPER PYMQAQYRDK WPLVKEYKKA FAAGEFNEIE AQLMAERKPA EELYDLDNDP 
HEVSNLAGVG AYKSQLTKMR GILNNWVKET GDKGQLPESD NGIREVLDFY HDKCQSPECQ 
SYRTRHQLSG NKSK