Gene SbBS512_E4441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4441
Symbol
ID	6272000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	4149124
End bp	4150857
Gene Length	1734 bp
Protein Length	577 aa
Translation table	11
GC content	50%
IMG OID	641728236
Product	hypothetical protein
Protein accession	YP_001882649
Protein GI	187732871
COG category	[R] General function prediction only
COG ID	[COG2194] Predicted membrane-associated, metal-dependent hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATTCCA CAGAAGTCCA GGCTAAACCC CTTTTTAGCT GGAAAGCCCT GGGTTGGGCA 
CTGCTCTACT TTTGGTTTTT CTCTACTCTG CTACAGGCCA TTATTTACAT CAGTGGTTAT 
AGTGGCACCA ACGGCATTCG CGACTCGCTG TTATTCAGCT CGCTGTGGTT GATCCCGGTA 
TTCCTCTTTC CGAAGCGGAT TAAAATTATT GCCGCAGTAA TCGGCGTGGT GCTATGGGCG 
GCCTCTCTGG CGGCGCTATG CTACTACGTC ATCTACGGGC AGGAGTTCTC GCAGAGCGTT 
CTGTTTGTGA TGTTCGAAAC CAACACCAAC GAAGCCAGCG AGTATTTAAG CCAGTATTTC 
AGCCTGAAAA TTGTGCTTAT CGCGCTGGCC TATACGGCGG TGGCAGTTCT GCTGTGGACA 
CGCCTGCGCC CGGTCTATAT TCCAAAGCCG TGGCGTTATG TTGTCTCTTT TGCCCTGCTT 
TATGGCTTGA TTCTGCATCC GATCGCCATG AATACGTTTA TCAAAAACAA GCCGTTTGAG 
AAAACGTTGG ATAACCTGGC CTCGCGTATG GAGCCTGCCG CACCGTGGCA ATTCCTGACC 
GGCTATTATC AGTATCGTCA GCAACTAAAC TCGCTAACAA AGTTACTGAA TGAAAATAAT 
GCCTTGCCGC CACTGGCTAA TTTCAAAGAT GAATCGGGTA ACGAACCGCG CACTTTAGTG 
CTGGTGATTG GCGAGTCGAC CCAGCGCGGA CGCATGAGTC TGTACGGTTA TCCGCGTGAA 
ACCACGCCGG AGCTGGATGC GCTGCATAAA ACCGATCCGA ATCTGACCGT GTTTAATAAC 
GTAGTTACGT CTCGTCCGTA CACCATTGAA ATCCTGCAAC AGGCGCTGAC CTTTGCCAAT 
GAAAAGAACC CGGATCTGTA TCTGACGCAG CCGTCGCTGA TGAACATGAT GAAACAGGCG 
GGTTATAAAA CCTTCTGGAT CACCAACCAG CAGACGATGA CCGCCCGCAA TACCATGCTG 
ACGGTATTTT CGCGCCAGAC CGACAAGCAG TACTACATGA ACCAGCAACG TACGCAGAGT 
GCGCGTGAAT ACGACACCAA CGTGCTGAAG CCGTTCCAGG ATGTGCTGAA TGACCCTGCG 
CCGAAGAAAC TGATCATCGT TCATCTGCTG GGTACGCATA TCAAATACAA ATACCGCTAC 
CCGGAAAATC AGGGCAAGTT TGATGGCAAT ACCGATCATG TTCCGCCAGG ATTAAGCGCA 
GAAGAGCTGG AATCATATAA CGATTATGAC AACGCTAACT TGTATAACGA TCATGTGGTT 
GCCAGCCTGA TTAAAGACTT TAAAGCGGCA GACCCGAACG GATTCCTTGT TTACTTCTCT 
GACCACGGTG AAGAGGTTTA CGACACGCCG CCGCACAAAA CTCAGGGGCG TAACGAAGAC 
AACCCGACGC GCCACATGTA CACCATTCCG TTCCTGCTGT GGACGTCGGA AAAATGGCAA 
GCGACTCATC CCCGTGATTT CTCACAGGAT GTCGATCGTA AATACAGCCT GGCGGAACTG 
ATCCACACCT GGTCAGATTT GGCGGGCTTA TCTTACGACG GTTACGATCC AACCCGTTCA 
GTGGTGAATC CGCAGTTCAA AGAAACTACC CGCTGGATTG GTAACCCGTA CAAGAAAAAC 
GCGCTGATCG ATTACGACAC TCTGCCGTAT GGCGACCAGG TAGGTAATCA GTAA

Protein sequence

MHSTEVQAKP LFSWKALGWA LLYFWFFSTL LQAIIYISGY SGTNGIRDSL LFSSLWLIPV 
FLFPKRIKII AAVIGVVLWA ASLAALCYYV IYGQEFSQSV LFVMFETNTN EASEYLSQYF 
SLKIVLIALA YTAVAVLLWT RLRPVYIPKP WRYVVSFALL YGLILHPIAM NTFIKNKPFE 
KTLDNLASRM EPAAPWQFLT GYYQYRQQLN SLTKLLNENN ALPPLANFKD ESGNEPRTLV 
LVIGESTQRG RMSLYGYPRE TTPELDALHK TDPNLTVFNN VVTSRPYTIE ILQQALTFAN 
EKNPDLYLTQ PSLMNMMKQA GYKTFWITNQ QTMTARNTML TVFSRQTDKQ YYMNQQRTQS 
AREYDTNVLK PFQDVLNDPA PKKLIIVHLL GTHIKYKYRY PENQGKFDGN TDHVPPGLSA 
EELESYNDYD NANLYNDHVV ASLIKDFKAA DPNGFLVYFS DHGEEVYDTP PHKTQGRNED 
NPTRHMYTIP FLLWTSEKWQ ATHPRDFSQD VDRKYSLAEL IHTWSDLAGL SYDGYDPTRS 
VVNPQFKETT RWIGNPYKKN ALIDYDTLPY GDQVGNQ