Gene SbBS512_E1993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1993
Symbol	astD
ID	6272502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	1816811
End bp	1818289
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	58%
IMG OID	641726046
Product	succinylglutamic semialdehyde dehydrogenase
Protein accession	YP_001880540
Protein GI	187733281
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR03240] succinylglutamic semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTTAT GGATTAACGG TGACTGGATA ACGGGCCAGG GCGCATCGCG TGTGAAGCGT 
AATCCGGTAT CGGGCGAGGT GTTATGGCAA GGCAATGATG CCGATGCCGC TCAGGTCGAA 
CAGGCTTGTC GGGCAGCCCG TGCGGCGTTT CCGCGCTGGG CGCGGCTCTC ATTGGCTGAA 
CGTCAGGTCG TTGTCGAACG CTTTGCCGGA TTGCTGGAAA GCAATAAAGC CGAATTAACC 
GCGATTATTG CCAGAGAAAC GGGTAAGCCG CGCTGGGAAG CGGCAACCGA AGTGACGGCG 
ATGATCAATA AAATCGCGAT ATCAATTAAG GCGTATCACG TTCGTACCGG CGAGCAGCGT 
AGTGAAATGC CGGACGGTGC GGCGAGCCTG CGACATCGCC CGCACGGCGT GCTGGCGGTG 
TTTGGGCCGT ATAATTTCCC TGGTCATTTG CCGAACGGAC ATATCGTTCC GGCATTGCTG 
GCAGGTAACA CCATTATCTT TAAACCCAGC GAACTGACAC CGTGGAGTGG CGAAGCGGTA 
ATGCGTTTAT GGCAGCAGGC TGGCTTGCCG CCGGGCGTGC TGAACCTGGT GCAGGGCGGG 
CGTGAAACGG GTCAGGCGCT GAGTGCGCTG GAGGATCTCG ACGGTTTGCT GTTTACCGGT 
CGCGCCAATA CCGGCTACCA GCTGCATCGC CAGCTCTCCG GTCAGCCGGA GAAAATTCTC 
GCCCTTGAGA TGGGCGGTAA TAATCCGCTA ATTATCGATG AGGTGGCGGA TATCGACGCG 
GCTGTCCATC TGACCATTCA GTCGGCGTTT GTCACAGCCG GGCAACGCTG CACCTGCGCC 
CGCCGTTTAT TGCTCAAAAG CGGAGCGCAG GGCGATGCGT TTCTTGCTCG TCTGGTTGCC 
GTCAGCCAGC GATTAACGCC GGGCAACTGG GATGACGAAC CGCAGCCGTT TATTGGCGGG 
CTGATTTCTG AACAGGCCGC ACAGCAGGTG GTTACTGCCT GGCAGCAACT GGAAGCGATG 
GGCGGACGAA CCCTGCTTGC GCCGCGCTTA TTACAATCAG AGACATCGTT GCTGACGCCG 
GGGATCATTG AAATGACAGG CGTTGCTGGC GTACCAGATG AAGAGGTGTT CGGACCGTTA 
TTGCGCGTCT GGCGTTATGA TTCTTTCGAG GAAGCGATTC TAATGGCGAA TAACACTCGC 
TTCGGACTCT CTTGCGGTCT GGTTTCCCCC GAGCGGGAAA AATTCGATCA ACTGTTGCTG 
GAGGCGCGGG CGGGGATTGT TAACTGGAAC AAACCGCTTA CTGGTGCTGC CAGTACCGCG 
CCATTCGGCG GCATTGGTGC ATCCGGTAAC CATCGCCCCA GCGCCTGGTA TGCCGCAGAT 
TACTGCGCAT GGCCTATGGC GAGCCTGGAG TCGGACTCGT TAACTTTGCC CGCAACGCTT 
AACCCCGGGC TGGATTTTTC CGATGAGGTG GTGCGATGA

Protein sequence

MTLWINGDWI TGQGASRVKR NPVSGEVLWQ GNDADAAQVE QACRAARAAF PRWARLSLAE 
RQVVVERFAG LLESNKAELT AIIARETGKP RWEAATEVTA MINKIAISIK AYHVRTGEQR 
SEMPDGAASL RHRPHGVLAV FGPYNFPGHL PNGHIVPALL AGNTIIFKPS ELTPWSGEAV 
MRLWQQAGLP PGVLNLVQGG RETGQALSAL EDLDGLLFTG RANTGYQLHR QLSGQPEKIL 
ALEMGGNNPL IIDEVADIDA AVHLTIQSAF VTAGQRCTCA RRLLLKSGAQ GDAFLARLVA 
VSQRLTPGNW DDEPQPFIGG LISEQAAQQV VTAWQQLEAM GGRTLLAPRL LQSETSLLTP 
GIIEMTGVAG VPDEEVFGPL LRVWRYDSFE EAILMANNTR FGLSCGLVSP EREKFDQLLL 
EARAGIVNWN KPLTGAASTA PFGGIGASGN HRPSAWYAAD YCAWPMASLE SDSLTLPATL 
NPGLDFSDEV VR