Gene SbBS512_E0806 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E0806
Symbol
ID	6271086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	755319
End bp	756407
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	52%
IMG OID	641724982
Product	hypothetical protein
Protein accession	YP_001879509
Protein GI	187730451
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0524] Sugar kinases, ribokinase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAACC GGGAAAAGGA GATCCTTGCA ATTTTACGGC GTAACCCGCT GATTCAGCAG 
AACGAAATTG CGGACATGCT GCAAATCAGT CGTTCGCGCG TTGCGGCGCA TATTATGGAT 
TTAATGCGCA AAGGGCGGAT TAAAGGCAAA GGTTACATTC TCACCGAGCA GGAATACTGC 
GTAGTGGTGG GGACAATCAA TATGGATATT CGCGGGATGG CGGATATCCG TTACCCGCAA 
GCGGCTTCTC ATCCCGGTAC AATTCATTGC TCGGCGGGCG GCGTGGGACG CAACATCGCC 
CACAATCTGG CGCTGTTAGG CCGTGACGTC CATTTGCTTT CAGTGATTGG CGATGACTTT 
TATGGCGAAA TGCTCCTGGA AGAAACGCGC CGTGCCGGCG TGAATGTCTC CGGCTGCGTT 
CGTTTGCATG GTCAAAGCAC ATCGACGTAT CTGGCAATTG CCAATCGAGA CGATCAAACC 
GTGCTGGCGA TTAACGATAC CCATCTGCTG GAACAGTTGA CACCGCAACT ACTGAACGGG 
TCGCGCGATT TACTTCGTCA TGCGGGCGTG GTACTGGCTG ATTGCAACCT GACAGCCGAG 
GCGCTGGAAT GGGTCTTTAC CCTCGCTGAT GAAATCCCGG TGTTTGTCGA TACCGTTTCA 
GAATTCAAAG CGGGCAAAAT CAAACACTGG CTGGCGCATA TTCACACCCT GAAACCCACT 
TTACCGGAGC TGGAAATTTT ATGGGGACAG GCGATCACCA GCGATGCTGA CCGTAATGCC 
GCAGTGAATG CATTGCATCA GCAAGGTGTT CAGCAACTGT TTGTTTATTT GCCCGATGAG 
TCAGTTTATT GCAGCGAAAA GGATGGAGAA CAATTTTTGC TGACCGCGCC AGCGCATACG 
ACAGTAGACA GTTTTGGTGC TGACGATGGT TTTATGGCGG GCCTAGTATA TAGCTTTCTT 
GAAGGATACA GTTTCCGCGA CAGCGCCCGT TTTGCGGTAG CCTGCGCGGC AATTTCGCGC 
GCCAGCGGCA GCTTAAACAA CCCTACCCTG TCTGCCGATA ACGCGCTTTC ATTAGTGCCA 
ATGGTGTAA

Protein sequence

MNNREKEILA ILRRNPLIQQ NEIADMLQIS RSRVAAHIMD LMRKGRIKGK GYILTEQEYC 
VVVGTINMDI RGMADIRYPQ AASHPGTIHC SAGGVGRNIA HNLALLGRDV HLLSVIGDDF 
YGEMLLEETR RAGVNVSGCV RLHGQSTSTY LAIANRDDQT VLAINDTHLL EQLTPQLLNG 
SRDLLRHAGV VLADCNLTAE ALEWVFTLAD EIPVFVDTVS EFKAGKIKHW LAHIHTLKPT 
LPELEILWGQ AITSDADRNA AVNALHQQGV QQLFVYLPDE SVYCSEKDGE QFLLTAPAHT 
TVDSFGADDG FMAGLVYSFL EGYSFRDSAR FAVACAAISR ASGSLNNPTL SADNALSLVP 
MV