Gene SbBS512_E2026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2026
Symbol	gapA
ID	6273161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	1845002
End bp	1845997
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	50%
IMG OID	641726074
Product	gIyceraldehyde-3-phosphate dehydrogenase (phosphorylating)
Protein accession	YP_001880568
Protein GI	187732440
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00000807541
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTATCA AAGTAGGTAT CAACGGTTTT GGCCGTATCG GTCGCATTGT TTTCCGTGCT 
GCTCAGAAAC GTTCTGACAT CGAGATCGTT GCAATCAACG ACCTGTTAGA CGCTGATTAC 
ATGGCATACA TGCTGAAATA TGACTCCACT CACGGCCGTT TCGACGGTAC CGTTGAAGTG 
AAAGACGGTC ATCTGATCGT TAACGGTAAA AAAATCCGTG TTACCGCTGA ACGTGATCCG 
GCTAACCTGA AATGGGACGA AGTTGGTGTT GACGTTGTCG CTGAAGCAAC TGGTCTGTTC 
CTGACTGACG AAACTGCTCG TAAACACATC ACCGCTGGTG CGAAGAAAGT GGTTATGACT 
GGTCCGTCTA AAGACAACAC TCCGATGTTC GTTAAAGGCG CTAACTTCGA CAAATATGCT 
GGCCAGGACA TCGTTTCCAA CGCTTCCTGC ACCACCAACT GCCTGGCTCC GCTGGCTAAA 
GTTATCAACG ATAACTTCGG CATCATCGAA GGTCTGATGA CCACCGTTCA CGCTACTACC 
GCTACTCAGA AAACCGTTGA TGGCCCGTCT CACAAAGACT GGCGCGGCGG CCGCGGCGCT 
TCCCAGAACA TCATCCCGTC CTCTACCGGT GCTGCTAAAG CTGTAGGTAA AGTACTGCCA 
GAACTGAATG GCAAACTGAC TGGTATGGCG TTCCGCGTTC CGACCCCGAA CGTATCCGTA 
GTTGACCTGA CCGTTCGTCT GGAAAAAGCT GCAACTTACG AGCAGATCAA AGCTGCCGTT 
AAAGCCGCTG CTGAAGGCGA AATGAAAGGC GTTCTGGGCT ACACCGAAGA TGACGTAGTA 
TCTACCGATT TCAACGGCGA AGTTTGCACT TCCGTGTTCG ATGCTAAAGC TGGTATCGCT 
CTGAACGACA ACTTCGTGAA ACTGGTATCC TGGTACGACA ACGAAACCGG TTACTCCAAC 
AAAGTTCTGG ACCTGATCGC TCACATCTCC AAATAA

Protein sequence

MTIKVGINGF GRIGRIVFRA AQKRSDIEIV AINDLLDADY MAYMLKYDST HGRFDGTVEV 
KDGHLIVNGK KIRVTAERDP ANLKWDEVGV DVVAEATGLF LTDETARKHI TAGAKKVVMT 
GPSKDNTPMF VKGANFDKYA GQDIVSNASC TTNCLAPLAK VINDNFGIIE GLMTTVHATT 
ATQKTVDGPS HKDWRGGRGA SQNIIPSSTG AAKAVGKVLP ELNGKLTGMA FRVPTPNVSV 
VDLTVRLEKA ATYEQIKAAV KAAAEGEMKG VLGYTEDDVV STDFNGEVCT SVFDAKAGIA 
LNDNFVKLVS WYDNETGYSN KVLDLIAHIS K