Gene Spro_3454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3454
Symbol
ID	5604733
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	3825427
End bp	3826515
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	60%
IMG OID	640939007
Product	sulfate/thiosulfate transporter subunit
Protein accession	YP_001479680
Protein GI	157371691
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1118] ABC-type sulfate/molybdate transport systems, ATPase component
TIGRFAM ID	[TIGR00968] sulfate ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.1858
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATTG AGATTAACGG TATCAATAAG TTTTTCGGTC GTACCAAGGT ATTGAACGAT 
ATCTCGCTCG ACATTGCCTC CGGTGAGATG GTGGCACTGC TGGGGCCGTC CGGCTCCGGT 
AAAACCACGC TGCTGCGTAT TATCGCCGGG CTGGAAAGCC AGAGCGGCGG CAAGCTGGGC 
TTCCACGGCA CCGACGTCAG CCACGTGCAT GCCCGCGATC GTCGAGTGGG CTTCGTGTTC 
CAGCATTACG CGCTGTTCCG CCACATGACG GTGTTCGACA ACATCGCCTT TGGCCTGAGC 
GTGCTGCCGC GCCGTGAGCG CCCGAATGCC GCGGCGATCA AACAAAAAGT GACCCAGTTG 
CTGGAAATGG TGCAGTTGGC CCATTTGGCT AACCGTTATC CGTCACAGCT TTCCGGTGGT 
CAGAAGCAGC GCGTGGCCCT GGCGCGTGCA CTGGCGGTCG AACCGCAAAT TCTGCTGCTG 
GATGAACCCT TCGGCGCGCT GGATGCGCAG GTGCGTAAAG AACTGCGTCG TTGGCTGCGT 
CAACTGCATG AAGAACTGAA ATTTACCAGC GTGTTTGTCA CCCACGATCA GGAAGAGGCA 
ATGGAAGTCG CCGATCGTAT CGTGGTGATG AGCCAGGGCA ATATTGAGCA GGTCGGTTCG 
CCGGAAGAGA TTGTACGTGA ACCGGCCAGC CGCTTCGTGC TGGAATTTAT GGGCGAAGTG 
AACCGCCTGA GCGGCGAGAT CCGCGGTTCG CAGCTGTTCG TCGGTGCGCA CCAGTGGCCT 
CTGTCGTTCC AGCCAATGCA CCAGGGCCGC GTGGACTTGT TCCTGCGCCC GTGGGAAATG 
GAAGTCGGTA CCGAGAGCAG CGACCGCTGC CCGCTGCCGG TGCAGGTGCT GGAAGTCAGC 
CCTCGCGGCC ATTTCTGGCA GATGACCGTG CAGCCGATTG GCTGGCATCA GGAACCTATC 
AGCGTGGTGC TGCCGGAGGG TAACGAACCG CCGGTACGCG GTGGCCGCTA CTACGTTGGC 
AGCCTGAATG CGCGCCTGTA CGCCGGTGAC CAACTGCTAC AACCTGTTGC GTTAGCTAAA 
AGCGCCTGA

Protein sequence

MSIEINGINK FFGRTKVLND ISLDIASGEM VALLGPSGSG KTTLLRIIAG LESQSGGKLG 
FHGTDVSHVH ARDRRVGFVF QHYALFRHMT VFDNIAFGLS VLPRRERPNA AAIKQKVTQL 
LEMVQLAHLA NRYPSQLSGG QKQRVALARA LAVEPQILLL DEPFGALDAQ VRKELRRWLR 
QLHEELKFTS VFVTHDQEEA MEVADRIVVM SQGNIEQVGS PEEIVREPAS RFVLEFMGEV 
NRLSGEIRGS QLFVGAHQWP LSFQPMHQGR VDLFLRPWEM EVGTESSDRC PLPVQVLEVS 
PRGHFWQMTV QPIGWHQEPI SVVLPEGNEP PVRGGRYYVG SLNARLYAGD QLLQPVALAK 
SA