Gene SbBS512_E3883 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3883
Symbol
ID	6270972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3606242
End bp	3607441
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	34%
IMG OID	641727737
Product	HNH endonuclease domain protein
Protein accession	YP_001882172
Protein GI	187730622
COG category	[S] Function unknown
COG ID	[COG3157] Hemolysin-coregulated protein (uncharacterized)
TIGRFAM ID	[TIGR03344] type VI secretion system effector, Hcp1 family

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAATA TTGTTTACCT GACAGTAACG GGAGAACAAC AAGGAAGCAT CTCCGCAGGT 
TGTGGGACTT CTGAGTCTAC AGGTAATCGT TGGCAGAGCG GGCATGAGGA TGAAATATTT 
ACATTCTCAC TCTTAAATAA TATTAATAAT ACGGGGCTTG GTTCACAGTT CCATGGTATA 
ACATTTTGTA AATTAATTGA TAAAAGCACT CCATTATTTA TTAATTCCAT TAACAATAAT 
GAACAATTAT TTATGGGATT TGACTTCTAT CGAATAAATA GATTTGGTAG ATTGGAAAAG 
TATTATTATA TACAACTAAG AGGCGCTTTT TTATCGGCTA TTCATCACCA GATCATTGAA 
AACCAACTGG ATACAGAAAC AATAACTATT AGTTATGAAT TTATCCTCTG TCAACATCTT 
ATCGCAAATA CCGAGTTCAG CTATTTGGCA CTCCCTGAAA ATTATAACCG TTTGTTTTTA 
CCAAATTCAA AAAACCAAAC AAATAATCGT TTCAAAACGT TAAACAGCAA AGCTATTGGC 
AGGCTACTTG CTGCTGGTGG CGTATACAAT GGGAACATTG AAGGATTCAG AGATACTGCG 
GAAAAACTGG GTGGAGATGC AATAAAAGGC TATGATCAAA TACTAAATGA AAAAACAGCG 
GGCATAGCGA TAGCAACAGC ATCTATTCTT TTAACAAAGC GTTCTAATGT TGATACATAT 
ACAGAAATAA ATAGTTACTT AGGCAAACTT AGAGGTCAAC AAAAACTTCT TGATGGTATA 
GACATAATAG AAATAATATA CATTAAGAGA CCTTCAAAAG ACTTAGCTAA CTTACGAAAG 
GAGTTTAATA AAACTGTAAG AAAAAATTTT CTTATCAAAC TTGCAAAAAC CTCCGAAGCA 
TCTGGAAGAT TCAACGCCGA AGACCTTTTA AGAATGAGAA AGGGCAATGT TCCTCTAAAT 
TATAATGTTC ACCATAAACT ATCTCTAGAT GATGGTGGTA CTAATGATTT CGAAAATTTA 
GTATTAATCG AAAACGAACC ATATCATAAA GTTTTTACTA ACATGCAATC ACGAATAGCT 
AAGGGAATAT TAGTAGGTGA AAGCAAAATC ACTCCCTGGG CCATTCCATC TGGCTCAATT 
TATCCTCCCA TGAAAAATGT AATGAACGCA TCCCACACAA TTAAACACGG AGCAGTATGA

Protein sequence

MSNIVYLTVT GEQQGSISAG CGTSESTGNR WQSGHEDEIF TFSLLNNINN TGLGSQFHGI 
TFCKLIDKST PLFINSINNN EQLFMGFDFY RINRFGRLEK YYYIQLRGAF LSAIHHQIIE 
NQLDTETITI SYEFILCQHL IANTEFSYLA LPENYNRLFL PNSKNQTNNR FKTLNSKAIG 
RLLAAGGVYN GNIEGFRDTA EKLGGDAIKG YDQILNEKTA GIAIATASIL LTKRSNVDTY 
TEINSYLGKL RGQQKLLDGI DIIEIIYIKR PSKDLANLRK EFNKTVRKNF LIKLAKTSEA 
SGRFNAEDLL RMRKGNVPLN YNVHHKLSLD DGGTNDFENL VLIENEPYHK VFTNMQSRIA 
KGILVGESKI TPWAIPSGSI YPPMKNVMNA SHTIKHGAV