Gene SbBS512_E2356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2356
Symbol
ID	6272196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	2142438
End bp	2144600
Gene Length	2163 bp
Protein Length	720 aa
Translation table	11
GC content	52%
IMG OID	641726359
Product	hypothetical protein
Protein accession	YP_001880841
Protein GI	187734165
COG category	[S] Function unknown
COG ID	[COG1289] Predicted membrane protein
TIGRFAM ID	[TIGR01435] glutamate--cysteine ligase/gamma-glutamylcysteine synthetase, Streptococcus agalactiae type [TIGR01666] hypothetical membrane protein, TIGR01666 [TIGR01667] integral membrane protein, YccS/YhfK family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0100238
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCTTTA TGCTAAGTCC TTTGCTCAAA CGCTATACCT GGAACAGCGC CTGGCTGTAT 
TACGCGCGTA TTTTTATTGC GCTTTGTGGA ACCACAGCGT TTCCGTGGTG GCTGGGTGAT 
GTAAAACTGA CGATTCCGCT AACGCTGGGG ATGGTGGCAG CGGCGCTGAC CGATCTCGAT 
GACCGACTGG CGGGACGTTT GCGTAACCTC ATCATTACGC TGTTCTGCTT TTTTATCGCC 
TCGGCCTCAG TAGAATTGCT GTTTCCCTGG CCCTGGCTAT TTGCGATTGG CTTAACGCTC 
TCTACCAGCG GCTTCATTTT GCTCGGCGGT CTGGGTCAAC GCTATGCAAC AATTGCCTTC 
GGTGCATTGC TGATCGCCAT TTACACTATG TTGGGAACAT CACTGTATGA GCACTGGTAT 
CAGCAGCCGA TGTATCTGCT GGCCGGTGCC GTCTGGTACA ACGTCCTGAC ACTTATTGGT 
CATCTGCTGT TCCCGGTCCG CCCGCTGCAG GACAACCTGG CGCGTTGCTA TGAACAACTG 
GCGCGTTATC TTGAGCTCAA GTCGCGCATG TTTGATCCTG ATATTGAAGA TGAAAGCCAG 
GCACCGCTGT ACGATTTGGC TCTCGCCAAC GGTCTGCTGA TGGCGACATT GAATCAGACG 
AAACTCTCGC TGCTGACCCG CTTACGTGGC GATCGTGGTC AACGGGGAAC GCGTCGCACG 
CTGCATTATT ACTTTGTCGC ACAGGATATT CACGAGCGTG CCAGCTCTTC TCATATTCAG 
TATCAAACAT TGCGTGAACA TTTTCGCCAC AGCGACGTGC TGTTCCGTTT TCAGCGGCTG 
ATGTCGATGC AGGGCCAGGC GTGCCAGCAA CTGTCACGCT GTATTTTGTT GCGTCAGCCT 
TATCAACATG ATCCGCATTT TGAGCGCGCT TTTACGCATA TTGATGCTGC GCTGGAGCGG 
ATGCGCGATA ACGGCGCACC CGCCGATTTA CTCAAAACAC TGGGATTTTT GCTGAACAAT 
TTACGCGCCA TTGATGCCCA ACTGGCAACA ATTGAATCAG AACAGGCCCA GGCACTACCC 
CATAATAATG ACGAAAATGA GCTCGCTGAT GACAGCCCGC ACGGGTTGAG TGATATCTGG 
CTGCGTCTTA GCCGTCACTT CACGCCGGAA TCCGCCCTCT TCCGTCATGC GGTAAGAATG 
TCGCTGGTGT TGTGCTTCGG CTACGCCATC ATTCAAATAA CCGGAATGCA TCACGGGTTT 
TGGATCTTGC TGACAAGTTT GTTTGTCTGC CAGCCAAACT ATAACGCCAC GCGCCACCGC 
CTGAAGTTAA GGATTATTGG TACGCTGGTA GGTATCGCCA TTGGCATTCC TGTGCTGTGG 
TTTGTGCCAT CACTGGAAGG GCAGCTGGTG CTGCTGGTTA TTACCGGCGT GCTCTTTTTT 
GCCTTCCGTA ACGTGCAATA CGCTCATGCA ACGATGTTCA TCACACTTTT GGTGCTACTG 
TGTTTTAACT TACTGGGTGA AGGTTTTGAA GTAGCGTTAC CTCGCGTAAT CGATACGCTG 
ATTGGTTGTG CCATTGCGTG GGCGGCAGTG AGCTACATCT GGCCTGACTG GCAGTTTCGC 
AATCTGCCGC GCATGCTCGA ACGCGCCACA GAGGCCAACT GTCGGTATCT CGATGCCATA 
CTGGAGCAAT ACCATCAGGG GCGTGATAAC CGTCTGGCGT ATCGTATTGC CCGCCGCGAT 
GCACACAACC GTGATGCTGA GCTGGCGTCG GTGGTATCAA ATATGTCCAG CGAGCCGAAC 
GTTACCCCGC AAATTCGCGA AGCCGCGTTT CGGTTGCTGT GCCTTAACCA TACGTTTACC 
AGCTATATCT CAGCCCTCGG TGCTCACCGG GAGCAGTTAA CTAATCCTGA AATTCTGGCG 
TTTCTTGATG ACGCAGTTTG CTATGTTGAT GACGCGTTAC ATCATCAACC TGCTGATGAA 
GAACGCGTCA ATGAGGCATT AGCTAGCCTG AAACAGCGGA TGCAGCAACT TGAACCACGG 
GCAGACAGCA AAGAACCTCT GGTCGTACAA CAAGTTGGAT TATTGATTGC ATTACTGCCT 
GAGATTGGTC GTCTGCAACG CCAGATTACT CAAGTTCCGC AGGAAACTCC TGTTTCGGCG 
TAA

Protein sequence

MAFMLSPLLK RYTWNSAWLY YARIFIALCG TTAFPWWLGD VKLTIPLTLG MVAAALTDLD 
DRLAGRLRNL IITLFCFFIA SASVELLFPW PWLFAIGLTL STSGFILLGG LGQRYATIAF 
GALLIAIYTM LGTSLYEHWY QQPMYLLAGA VWYNVLTLIG HLLFPVRPLQ DNLARCYEQL 
ARYLELKSRM FDPDIEDESQ APLYDLALAN GLLMATLNQT KLSLLTRLRG DRGQRGTRRT 
LHYYFVAQDI HERASSSHIQ YQTLREHFRH SDVLFRFQRL MSMQGQACQQ LSRCILLRQP 
YQHDPHFERA FTHIDAALER MRDNGAPADL LKTLGFLLNN LRAIDAQLAT IESEQAQALP 
HNNDENELAD DSPHGLSDIW LRLSRHFTPE SALFRHAVRM SLVLCFGYAI IQITGMHHGF 
WILLTSLFVC QPNYNATRHR LKLRIIGTLV GIAIGIPVLW FVPSLEGQLV LLVITGVLFF 
AFRNVQYAHA TMFITLLVLL CFNLLGEGFE VALPRVIDTL IGCAIAWAAV SYIWPDWQFR 
NLPRMLERAT EANCRYLDAI LEQYHQGRDN RLAYRIARRD AHNRDAELAS VVSNMSSEPN 
VTPQIREAAF RLLCLNHTFT SYISALGAHR EQLTNPEILA FLDDAVCYVD DALHHQPADE 
ERVNEALASL KQRMQQLEPR ADSKEPLVVQ QVGLLIALLP EIGRLQRQIT QVPQETPVSA