Gene SbBS512_E2794 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2794
Symbol	cysA
ID	6270286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	2592078
End bp	2593175
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	58%
IMG OID	641726748
Product	sulfate/thiosulfate transporter subunit
Protein accession	YP_001881221
Protein GI	187734158
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1118] ABC-type sulfate/molybdate transport systems, ATPase component
TIGRFAM ID	[TIGR00968] sulfate ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATTG AGATTGCCAA TATTAAGAAG TCGTTTGGTC GCACCCAGGT GCTGAACGAT 
ATCTCACTGG ATATTCCTTC TGGTCAGATG GTCGCGCTGC TGGGGCCGTC CGGTTCCGGA 
AAAACCACGC TGCTGCGCAT TATTGCCGGG CTGGAGCATC AAACCAGCGG GCATATTCGC 
TTCCACGGTA CCGACGTGAG CCGCCTGCAC GCACGCGATC GTAAAGTCGG TTTCGTGTTC 
CAGCATTACG CGCTGTTCCG TCATATGACG GTGTTCGACA ATATCGCTTT TGGCCTGACG 
GTGCTGCCAC GTCGCGAGCG CCCGAATTCC GCAGCCATCA AAGCGAAAGT GACAAAATTG 
CTGGAGATGG TCCAGCTTGC GCATCTGGCG GATCGTTATC CGGCACAGCT TTCCGGCGGC 
CAGAAACAGC GCGTGGCGCT GGCGCGCGCG CTGGCTGTTG AACCGCAAAT TCTCCTGCTT 
GATGAACCGT TTGGCGCGCT GGATGCGCAG GTGCGTAAAG AGCTGCGTCG CTGGCTGCGT 
CAACTGCATG AAGAGCTGAA ATTCACCAGC GTGTTCGTGA CCCACGACCA GGAAGAAGCG 
ACCGAAGTAG CTGATCGTGT AGTGGTGATG AGCCTGGGCA ATATCGAGCA GGCTGATGCG 
CCGGACCAGG TATGGCGCGA ACCAGCGACC CGATTTGTGC TCGAATTTAT GGGCGAAGTG 
AACCGCCTGC AGGGAACCAT TCGCGGCGGG CAGTTCCATG TTGGCGCACA TCGCTGGCCG 
CTGGGGTATA CGCCTGCGTA TCAGGGGCTG GTGGATCTCT TCCTGCGCCC GTGGGAAGTG 
GATATCAGCC GCCGTACCAG TCTCGATTCG CCGCTGCCGG TACAGGTACT GGAAGCCAGC 
CCGAAAGGTC ACTACACCCA ATTAGTGGTG CAGCCGCTGG GGTGGTACAA CGAACCGCTG 
ACGGTCGTGA TGCATGGCGA CGATGCCCCG CAGCGTGGCG AGCGTTTATT CGTTGGTCTG 
CAACATGCGT GGCTGTATAA CGGCGACGAG CGTATCGAAA CCCGAGATGA GGAACTTGCT 
CTCGCACAAA GCGCCTGA

Protein sequence

MSIEIANIKK SFGRTQVLND ISLDIPSGQM VALLGPSGSG KTTLLRIIAG LEHQTSGHIR 
FHGTDVSRLH ARDRKVGFVF QHYALFRHMT VFDNIAFGLT VLPRRERPNS AAIKAKVTKL 
LEMVQLAHLA DRYPAQLSGG QKQRVALARA LAVEPQILLL DEPFGALDAQ VRKELRRWLR 
QLHEELKFTS VFVTHDQEEA TEVADRVVVM SLGNIEQADA PDQVWREPAT RFVLEFMGEV 
NRLQGTIRGG QFHVGAHRWP LGYTPAYQGL VDLFLRPWEV DISRRTSLDS PLPVQVLEAS 
PKGHYTQLVV QPLGWYNEPL TVVMHGDDAP QRGERLFVGL QHAWLYNGDE RIETRDEELA 
LAQSA