Gene SbBS512_E2487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2487
Symbol
ID	6268397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	2286906
End bp	2288006
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	55%
IMG OID	641726479
Product	phage late control gene D protein
Protein accession	YP_001880959
Protein GI	187734053
COG category	[R] General function prediction only
COG ID	[COG3500] Phage protein D
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATTTCA GCTCTGAACT GCTTAACAAA GGCAACAAAA CTCCGGCATT CAGCATCAGT 
ATTGAAGGCA GGGATATCAC CACTGTGCTG GACAACCGCC TGATGGGGCT GACGCTGACG 
GATAACCGGG GCTTTGAAGC GGACCAGCTT GATCTGGAGC TGGACGACGC CGATGGAAAA 
ATCGTGCTGC CGCGCCGTGG GGCTGTCATT ACGCTGGCGC TGGGCTGGAA GGGACAGCCG 
CTTTTCCCGA AAGGGGCATT CACGGTGGAC GAGATTGAAC ACACTGGCGC ACCGGATCGC 
CTGACTATCC GGGCGCGAAG TGCTGATTTT CGTGAAACGC TGAATACCCG CCGTGAAAAG 
TCGTGGCACA AGACCACCGT TGGGGAAGTG GTGAAGGAAA TAGCTGCGCG GCACAAACTG 
AAGATGGCAT TGGGTGAAGA CTTGTCGGAT AAACTCGTGG AGCATATAGA CCAGACTAAT 
GAGAGTGACG GCAGTTTTTT GATGCGGCTG GCGCGCCAGT ACGGTGCTAT TGCGTCGGTG 
AAAAATGGCA ATCTGTTATT CATCCGGCAG GGGCAGGGTA AAAGCGCCAG CGGTAAACCA 
CTACCGGTGA TCACTATCAC ACGCAAGGAC GGCGACAGTC ACCGCTTTAC CCTGGCAGAT 
CGCGGAGCTT ACACGGGCGT CATTGCCAGC TGGTTGCATA CCCGCGAACC CGCGAAGAAA 
GAAAGCACCA CGGTGAAGCG TAAGCGCAGG ACTAAGAAGC AGAAGAAAGA GCCGGAAGCG 
AAGCAGGGCG ATTACCTGGT GGGTACGGAT GAAAACGTGC TGGTACTTAA TCGCACTTAT 
GCCAACCGGA GCAACGCCGA ACGGGCAGCG AAAATGCAGT GGGAACGCCT GCAACGCGGC 
GTTGCATCAT TCTCGCTACA ACTGGCGGAA GGGCGGGCAG ATCTCTACAC AGAAATGCCT 
GTGAAGGTCA GTGGCTTTAA ACAGCCGATA GATGATGCGG AATGGACCAT TACGACTCTG 
ACGCATACTG TCAGCCCGGA TAACGGTTTT ACGACCAGTC TGGAGCTTGA AGTGAGGATT 
GATGATTTCG AAATGGAATG A

Protein sequence

MNFSSELLNK GNKTPAFSIS IEGRDITTVL DNRLMGLTLT DNRGFEADQL DLELDDADGK 
IVLPRRGAVI TLALGWKGQP LFPKGAFTVD EIEHTGAPDR LTIRARSADF RETLNTRREK 
SWHKTTVGEV VKEIAARHKL KMALGEDLSD KLVEHIDQTN ESDGSFLMRL ARQYGAIASV 
KNGNLLFIRQ GQGKSASGKP LPVITITRKD GDSHRFTLAD RGAYTGVIAS WLHTREPAKK 
ESTTVKRKRR TKKQKKEPEA KQGDYLVGTD ENVLVLNRTY ANRSNAERAA KMQWERLQRG 
VASFSLQLAE GRADLYTEMP VKVSGFKQPI DDAEWTITTL THTVSPDNGF TTSLELEVRI 
DDFEME