Gene SbBS512_E2331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2331
Symbol	ymcA
ID	6271233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	2118385
End bp	2120481
Gene Length	2097 bp
Protein Length	698 aa
Translation table	11
GC content	52%
IMG OID	641726335
Product	group 4 capsule (G4C) polysaccharide, lipoprotein YmcA
Protein accession	YP_001880818
Protein GI	187732989
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0175694
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAGA ATTCTTATCT TTTAAGCTGC CTGGCCATTG CCGTCTCCAG TGCCTGTCAT 
GCTGAAGTAT TAACCTACCC GGATCCGCTG GGTTCGTCGC AATCAGACTT TGGCGGCACA 
GGATTGTTGC AGATGCCAAA TGCGCGCATC GCACCGGAAG GTGAATTCAG CGTCAACTAC 
CGGGATAACG ATCAATACCG GTTCTACTCC ACCTCCGTGG CGCTGTTCCC ATGGCTGGAA 
GGCACCATTC GTTATACGGA TGTGCGCACA CGCAAATATA GCCAGTGGGA AGATTTCAGC 
GGCGATCAGT CATACAAAGA CAAATCATTC GATTTTAAAC TTCGCCTGTG GGAAGAAGGT 
TACTGGCTAC CGCAAGTGGC GTTTGGTAAA CGTGATATTG CTGGTACGGG TCTGTTTGAC 
GGTGAGTATC TGGTGGCCAG CAAGCAAGCG GGGCCATTTG ATTTCACCCT CGGGATGGCA 
TGGGGCTACG CCGGTAATGC GGGCAATATT ACCAACCCGT TTTGCCGGGT GAGCGATAAA 
TATTGTCATC GCGCAGAGTC TCACGATGCG GGCGATATCA GCTTTAGCGA TATCTTTCGT 
GGCCCGGCTT CCATCTTTGG CGGCATTGAG TATCAAACGC CGTGGAATCC CCTGCGTCTG 
AAACTCGAAT ACGATGGCAA CAATTACCAG AATGATTTCG CTGGCAAACT GCCTCAGGCA 
AGCCATTTCA ACGTCGGCGC AGTTTATCGC GCTGCCAGCT GGGCAGATCT CAACCTGAGT 
TATGAACGCG GTAACACGTT GATGTTTGGC TTCACGTTAC GGACCAATTT CAACGATCTG 
CGCCCTGCCC TGCGCGATAC GCCAAAACCG GCATATCAAC CTGCGCCTGA ATCTGAAGGA 
TTGCAGTACA CCACAGTAGC GAACCAACTT ACCGCGCTGA AGTACAACGC AGGTTTTGAA 
GCACCGGAAA TTCAGCTGCG CGATAAGACG CTGTATATGT CTGGTCAACA ATACAAATAC 
CGTGATTCTC GCGAAGCGGT CGATCGTGCC AACCGGATTC TGGTGAATAA CCTGCCGCAA 
GGCGTTGAGA AGATTAGCGT GACGCAAAAG CGCGAGCATA TGGCGATGGT GACTACCGAA 
ACCGACGTAG CCAGCCTGCG CAAACAGCTG GCTGGTACAG CGCCTGGTCA ATCAGAGCAA 
CTTCAACAAC AACGTGTTGA AGCAGAAGAT CTTTCTGCCT TTGGTCGGGG CTACCGTATT 
CGTGAAGATC GCTTTAGCTA CTCTTTCAAC CCAACACTTT CACAGTCGCT GGGCGGCCCG 
GAAGATTTCT ATATGTTCCA GCTGGGGCTG ATGCCCAGTG CCCGCTACTG GTTTACCGAC 
CACCTGCTGC TTGATGGCGG TATTTTCACC AATATTTACA ACAACTACGA CAAGTTTAAG 
TCTTCGCTGT TGCCCGCGGA CTCTACCCTG CCCCGCGTGC GCACGCATAT CCGTGATTAC 
GTTCGCAATG ACGTTTATCT CAACAACTTG CAGGCGAACT ACTTTGCCGA CTTAGGCAAT 
GGTTTCTATG GCCAGGTGTA TGGCGGTTAT CTGGAAACGA TGTACGCCGG TGTCGGTTCC 
GAGCTGCTTT ATCGCCCGCT AGATGCCAGC TGGGCGCTGG GTGTGGACGT TAACTACGTG 
AAGCAACGTG ACTGGGACAA CATGATGCGC TTCACCGATT ATTCCACGCC AACTGGTTTC 
GTGACGGCTT ACTGGAACCC GCCGACGCTC AATGGCGTAC TGATGAAACT TAGCGTTGGG 
CAATATCTGG CAAAAGATAA AGGCGCAACG ATCGACGTCG CCAAACGCTT TGACAGCGGC 
GTGGCGGTAG GGGTATGGGC GGCAATCAGT AACGTATCTA AAGATGACTA CGGCGAAGGC 
GGCTTTAGTA AAGGTTTTTA TATCTCGATT CCATTCGACT TGATGACCAT TGGACCTAAC 
CGCAACCGCG CGGTGGTTTC GTGGACACCA TTGACGCGTG ATGGTGGACA AATGCTGTCA 
CGCAAATACC AGCTCTATCC AATGACGGCA GAGCGAGAAG TACCGGTTGG ACAATAA

Protein sequence

MKKNSYLLSC LAIAVSSACH AEVLTYPDPL GSSQSDFGGT GLLQMPNARI APEGEFSVNY 
RDNDQYRFYS TSVALFPWLE GTIRYTDVRT RKYSQWEDFS GDQSYKDKSF DFKLRLWEEG 
YWLPQVAFGK RDIAGTGLFD GEYLVASKQA GPFDFTLGMA WGYAGNAGNI TNPFCRVSDK 
YCHRAESHDA GDISFSDIFR GPASIFGGIE YQTPWNPLRL KLEYDGNNYQ NDFAGKLPQA 
SHFNVGAVYR AASWADLNLS YERGNTLMFG FTLRTNFNDL RPALRDTPKP AYQPAPESEG 
LQYTTVANQL TALKYNAGFE APEIQLRDKT LYMSGQQYKY RDSREAVDRA NRILVNNLPQ 
GVEKISVTQK REHMAMVTTE TDVASLRKQL AGTAPGQSEQ LQQQRVEAED LSAFGRGYRI 
REDRFSYSFN PTLSQSLGGP EDFYMFQLGL MPSARYWFTD HLLLDGGIFT NIYNNYDKFK 
SSLLPADSTL PRVRTHIRDY VRNDVYLNNL QANYFADLGN GFYGQVYGGY LETMYAGVGS 
ELLYRPLDAS WALGVDVNYV KQRDWDNMMR FTDYSTPTGF VTAYWNPPTL NGVLMKLSVG 
QYLAKDKGAT IDVAKRFDSG VAVGVWAAIS NVSKDDYGEG GFSKGFYISI PFDLMTIGPN 
RNRAVVSWTP LTRDGGQMLS RKYQLYPMTA EREVPVGQ