Gene SbBS512_E1808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1808
Symbol	malI
ID	6269832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	1654781
End bp	1655809
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	55%
IMG OID	641725876
Product	DNA-binding transcriptional repressor MalI
Protein accession	YP_001880374
Protein GI	187731477
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTACCG CCAAAAAAAT AACCATTCAT GATGTTGCGC TGGCTGCGGG CGTGTCGGTA 
AGTACCGTTT CGCTGGTGCT TAGTGGCAAA GGGCGAATCT CTACCGCCAC AGGAGAACGC 
GTTAACGCCG CCATTGAAGA GCTGGGATTT GTGCGCAATC GCCAGGCGTC GGCGCTGCGC 
GGCGGGCAAA GCGGCGTCAT TGGTTTGATC GTCCGTGATT TATCTGCGCC GTTTTACGCC 
GAATTGACGG CCGGATTGAC GGAAGCTCTG GAAGCGCAGG GACGGATGGT TTTTTTGCTT 
CACGGCGGTA AAGACGGCGA GCAGCTGGCA CAGCGGTTTT CACTGTTACT GAATCAGGGG 
GTCGATGGTG TGGTAATTGC CGGGGCTGCA GGAAGCAGCG ATGACCTGCG ACGGATGGCA 
GAAGAAAAAG CTATCCCGGT GATTTTCGCT TCCCGTGCCA GTTATCTTGA TGATGTTGAT 
ACGGTTCGCC CGGACAACAT GCAGGCTGCA CAGTTGTTGA CGGAGCATCT CATTCGCAAT 
GGGCATCAGC GGATCGCCTG GCTGGGAGGG CAAAGTTCCT CATTAACCCG GGCAGAACGG 
GTGGGAGGCT ATTGTGCAAC TCTACTAAAA TTTGGCCTGC CGTTTCACAG CGATTGGGTG 
CTGGAGTGCA CATCCAGCCA GAAGCAAGCT GCGGAAGCTA TCACGGCGCT TTTACGTCAT 
AACCCGACCA TCAGTGCTGT GGTTTGCTAT AACGAAACTA TTGCGATGGG GGCATGGTTT 
GGTTTGCTGA AAGCAGGGCG GCAAAGCGGG GAAAGCGGAG TCGATCGTTA CTTTGAGCAA 
CAAGTTTCGC TGGCGGCATT TACCGATGCG ACACCAACCA CACTTGATGA TATACCCGTT 
ACCTGGGCCA GCACGCCTGC GCGGGAACTT GGTACCACAC TTGCGGATCG CATGATGCAA 
AAAATCACCC ATGAAGAGAC GCATTCACGC AATCTTATTA TTCCCGCCCG GCTCATTGCA 
GCGAAATAA

Protein sequence

MATAKKITIH DVALAAGVSV STVSLVLSGK GRISTATGER VNAAIEELGF VRNRQASALR 
GGQSGVIGLI VRDLSAPFYA ELTAGLTEAL EAQGRMVFLL HGGKDGEQLA QRFSLLLNQG 
VDGVVIAGAA GSSDDLRRMA EEKAIPVIFA SRASYLDDVD TVRPDNMQAA QLLTEHLIRN 
GHQRIAWLGG QSSSLTRAER VGGYCATLLK FGLPFHSDWV LECTSSQKQA AEAITALLRH 
NPTISAVVCY NETIAMGAWF GLLKAGRQSG ESGVDRYFEQ QVSLAAFTDA TPTTLDDIPV 
TWASTPAREL GTTLADRMMQ KITHEETHSR NLIIPARLIA AK