Gene SbBS512_E1139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1139
Symbol
ID	6269045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	1030510
End bp	1031514
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	55%
IMG OID	641725268
Product	ADP-ribosylglycohydrolase family protein
Protein accession	YP_001879786
Protein GI	187734052
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1397] ADP-ribosylglycohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.130877
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACAG AACGTATTCT CGGTGCTCTT TATGGGCAGG CGTTAGGGGA TGCGATGGGG 
ATGCCCTCCG AGCTTTGGCC ACGCAGCCGC GTTAAAGCAC ACTTTGGCTG GATTGACCGT 
TTTCTTCCTG GACCAAAGGA GAATAACGCG GCCTGTTATT TTAACCGCGC CGAATTCACC 
GACGATACCT CGATGGCGCT GTGTCTGGCG GATGCGTTAC TGGAACGTGA AGGCAAGATC 
GATCCGAATC TTATTGGGCG TAATATTCTC GACTGGGCGC TGCGTTTCGA CGCCTTTAAC 
AAAAACGTAC TAGGTCCGAC CTCGAAGATT GCTCTCAACG CCATTCGCGA CGGTAAACCC 
GTTGCTGAAC TGGAAAACAA TGGCGTGACC AACGGCGCGG CAATGCGCGT CTCGCCATTA 
GGTTGTTTGC TTCCGGCGCG TGATGTTGAT TCCTTTATTG ATGATGTGGC GCTGGCGTCC 
AGCCCGACCC ATAAATCCGA TCTGGCGGTT GCGGGCGCGG TAGTCATCGC ATGGGCGATT 
TCTCGTGCCA TTGACGGAGA AAGCTGGTCA GCGATTGTAG ATTCACTGCC TTCAATTGCG 
CGACATGCCC AGCAAAAACG CATCACCACC TTCAGCGCCT CACTGGCAGC ACGTCTGGAG 
ATTGCGCTGA AAATTGTGCG CAATGCCGAC GGCACTGAAT CCGCCAGCGA ACAGCTGTAT 
CAGGTCGTTG GCGCAGGTAC CAGCACTATC GAGTCCGTTC CGTGCGCCAT TGCGCTGGTT 
GAACTGGCAC AAACCGACCC GAACCGTTGC GCCGTCCTCT GCGCTAACCT TGGCGGCGAT 
ACAGACACCA TCGGTGCTAT GGCGACGGCA ATCTGCGGCG CGTTGCATGG CATTAACGCT 
ATCGATCCTC CGTTAAAGGC GGAGCTGGAT GCGGTAAATC AGCTTGATTT CAACCGCTAT 
GCCACAGCGC TGGCGAAATA TCGTCAACAA CGGGAGGCGG TATGA

Protein sequence

MKTERILGAL YGQALGDAMG MPSELWPRSR VKAHFGWIDR FLPGPKENNA ACYFNRAEFT 
DDTSMALCLA DALLEREGKI DPNLIGRNIL DWALRFDAFN KNVLGPTSKI ALNAIRDGKP 
VAELENNGVT NGAAMRVSPL GCLLPARDVD SFIDDVALAS SPTHKSDLAV AGAVVIAWAI 
SRAIDGESWS AIVDSLPSIA RHAQQKRITT FSASLAARLE IALKIVRNAD GTESASEQLY 
QVVGAGTSTI ESVPCAIALV ELAQTDPNRC AVLCANLGGD TDTIGAMATA ICGALHGINA 
IDPPLKAELD AVNQLDFNRY ATALAKYRQQ REAV