Gene Spro_3457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3457
Symbol
ID	5604745
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	3828213
End bp	3829235
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	56%
IMG OID	640939010
Product	thiosulfate transporter subunit
Protein accession	YP_001479683
Protein GI	157371694
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4150] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACAAA CGCGGGTTAA AAATATCGTA CTGAAAGGAT GGTTGGCGGC GGCGCTGTTA 
GCCAGCGGCC CGCTGTCGGC AACCGAATTG CTGAACAGCT CCTATGACGT TTCCCGTGAA 
TTGTTTACCG CGCTGAACCC AGGTTTTGAG CAGCAATGGA ACCAACAGCA TCCGGGCGAC 
AAGCTGACCA TCAAACAATC CCACGCCGGC TCCTCCAAGC AGGCGCTGGC GATCCTGCAG 
GGGTTGCGCG CCGACGTAGT GACCTACAAC CAGGTGACCG ACGTGCAGAT CCTGCACGAT 
CGCGGCCAAC TGATCCCGGC TGACTGGCAG ACCCGTTTAC CGAACAACAG CTCTCCTTTC 
TATTCCACCA TGGCTTTCCT GGTGCGTAAG GACAATCCAA AAGGCATTCA TAACTGGAAT 
GATTTGGTGC GTGACGACGT GAAGCTGGTG TTCCCGAACC CGAAAACCTC CGGTAACGGC 
CGTTATACCT ATCTGGCCGC CTGGGGCGCT GCCAATCAGG CGGATGGCAA TGATCAGGCC 
AAAACCCGCG CCTTTATGAC CCGTTTCCTG AAAAACGTTC TGGTGTTTGA CACCGGCGGC 
CGCGGCGCGA CCACTACCTT CGTCGAGCGC GGCCTGGGCG ACGTGCTGAT CAGTTTTGAG 
TCGGAAGTGA ACAATATTCG CAAGCAGTAT GGCGAAGACA AATACGAGGT GATCGTGCCG 
CCGGTCGATA TTCTGGCGGA ATTCCCGGTG GCCTGGGTCG ATAAAAACGT GGCAAGAAAC 
GGCACCGAAC AGGCGGCCAA AGACTACCTG AATTATCTCT ACAGCCCGGC AGCACAGCAG 
GTGATCACCA GCTACTACTA TCGCGTTTAC GACAAACAGG CGATGGCCGC GGCCAAAGGG 
CAGTTCCCGG AGACCAAGTT GTTCCGGGTG GAAGATCAGT TTGGTGGCTG GCCGCAGGTG 
ATGAAAACGC ATTTCTCCAC CGGTGGCGAG TTGGATCAGC TGTTAGCCGC AGGGCATAAG 
TAA

Protein sequence

MKQTRVKNIV LKGWLAAALL ASGPLSATEL LNSSYDVSRE LFTALNPGFE QQWNQQHPGD 
KLTIKQSHAG SSKQALAILQ GLRADVVTYN QVTDVQILHD RGQLIPADWQ TRLPNNSSPF 
YSTMAFLVRK DNPKGIHNWN DLVRDDVKLV FPNPKTSGNG RYTYLAAWGA ANQADGNDQA 
KTRAFMTRFL KNVLVFDTGG RGATTTFVER GLGDVLISFE SEVNNIRKQY GEDKYEVIVP 
PVDILAEFPV AWVDKNVARN GTEQAAKDYL NYLYSPAAQQ VITSYYYRVY DKQAMAAAKG 
QFPETKLFRV EDQFGGWPQV MKTHFSTGGE LDQLLAAGHK