Gene SbBS512_E2809 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2809
Symbol
ID	6271869
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	2606322
End bp	2607374
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	53%
IMG OID	641726762
Product	transcriptional regulator EutR
Protein accession	YP_001881235
Protein GI	187731112
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGA CCCGTACAGC CAATTTGCAC CATCTTTATC ATGAACCCTT ACCCGAAAAC 
CTGAAGCTCA CGCCGAAGGT CGAAGTGGAT AATGTTCATC AACGACAGAC AACGGATGTC 
TATGAACATG CTTTAACGAT TACCGCCTGG CAGCAGATTT ACGATCAGCT GCATCCGGGC 
AAGTTTCATG GTGAATTTAC GGAAATTCTA CTCGATGATA TTCAGGTTTT TCGTGAATAC 
ACCGGTCTGG CGCTGCGTCA GTCGTGCCTG GTCTGGCCGA ACTCGTTCTG GTTTGGCATT 
CCGGCGACGC GCGGTGAGCA GGGATTTATC GGTTCGCAAT GTCTGGGAAG CGCGGAAATC 
GCCACCCGCC CTGGTGGCAC TGAATTTGAA CTGAGCACGC CGGATGATTA CACGATCCTG 
GGCGTGGTGC TTTCTGAAGA TGTCATCACC CGGCAGGCTA ACTTTTTGCA TAACCCGGAT 
CGGGTATTAC ATATGCTGCG TAGCCAGTCG GCGCTGGAAG TGAAAGAGCA GCATAAAGCC 
GCGCTGTGGG GCTTTGTCCA ACAGGCGCTG GCGACGTTTT GCGAGAACCC GGAAAATCTC 
CATCAGCCTG CAGTGCGAAA AGTGCTGGGG GATAATTTGC TAATGGCGAT GGGGGCGATG 
CTGGAAGACG CGCAACCAAT GGTGACGGCG GAAAGCATCA GTCATCAGAG TTACCGTAGA 
TTACTTTCCC GCGCCCGTGA ATATGTGCTG GAAAATATGT CTGAGCCGGT GACGGTGCTG 
GACTTGTGTA ATCAACTGCA TGTCAGTCGC CGCACGCTAC AAAACGCGTT TCACGCTATT 
TTAGGCATTG GCCCAAACGC GTGGCTGAAA CGCATTCGCC TGAACGCCGT ACGCCGCGAA 
CTGATAAGCC CGTGGTCGCA AAGCACAACG GTAAAAGACG CCGCCATGCA GTGGGGATTC 
TGGCATCTGG GGCAATTTGT CACGGATTAC CAGCAGCTGT TTGCCGAGAA GCCGTCGTTG 
ACGTTGCATC AGCGGATGCG GGAATGGGGG TGA

Protein sequence

MKKTRTANLH HLYHEPLPEN LKLTPKVEVD NVHQRQTTDV YEHALTITAW QQIYDQLHPG 
KFHGEFTEIL LDDIQVFREY TGLALRQSCL VWPNSFWFGI PATRGEQGFI GSQCLGSAEI 
ATRPGGTEFE LSTPDDYTIL GVVLSEDVIT RQANFLHNPD RVLHMLRSQS ALEVKEQHKA 
ALWGFVQQAL ATFCENPENL HQPAVRKVLG DNLLMAMGAM LEDAQPMVTA ESISHQSYRR 
LLSRAREYVL ENMSEPVTVL DLCNQLHVSR RTLQNAFHAI LGIGPNAWLK RIRLNAVRRE 
LISPWSQSTT VKDAAMQWGF WHLGQFVTDY QQLFAEKPSL TLHQRMREWG