Gene SbBS512_E2411 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2411
Symbol
ID	6270558
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	2207428
End bp	2208459
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	50%
IMG OID	641726408
Product	DNA internalization-related competence protein ComEC/Rec2 homolog
Protein accession	YP_001880890
Protein GI	187731750
COG category	[R] General function prediction only
COG ID	[COG2333] Predicted hydrolase (metallo-beta-lactamase superfamily)
TIGRFAM ID	[TIGR00361] DNA internalization-related competence protein ComEC/Rec2

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCATTTAA GCGGGCCGTT AATCCTGGAG CAAGGGTTAT GGTTTCTTGC CGACCGGTCT 
TTGGCTTTAC TTTTCTGGGG GTTAAAGAGT TTGCCAGAAG GGTGGATCAA CATTGCTGAA 
CGTTGGCAAT GGCTATCATT TTCCCCATGG TTCTTACTGG TGGTATGGCG ATTAAACGTC 
TGGCGAACGT TGCCAGCAAT GTGTGTGGCT GTAGGCTTGC TGATGTGCTG GCCGCTGTGG 
CAAAAACCTC GACCTGACGA GTGGCAGGTG TACATGCTTG ATGTCGGGCA AGGGCTGGCA 
ATGGTGATAG CCAGAAACGG CAAAGCGATT CTCTATGACA CAGGACTGGC CTGGCCCGAA 
GGGGATAGTG GGCAACAACT GATTATCCCC TGGCTCCACT GGCATAATCT TGAACCGGAA 
GGCGTTATTC TGAGTCATGA ACATCTGGAT CACCGGGGAG GGCTGGACTC AATATTGCAC 
ACATGGCCGA TGTTATGGAT CAGAAGTCCG TTAAACTGGG AACATCATCA GCCCTGTGTG 
CGTGGCGAAG CGTGGCAATG GCAAGGATTG CGTTTCAGCG TGCACTGGCC TTTACAAGCT 
AGCAACGATA AAGGAAATAA CCATTCCTGT GTGGTTAAGG TTTATGACGG GACGAATAGC 
ATTCTTCTAA CCGGTGATAT TGAAGTCCCC GCTGAACAAA AGATGCTAAG CCGTTACTGG 
CAGCAAGTGC AGACAACATT GCTTCAGGTA CCTCACCATG GCAGTAATAC CTCATCATCG 
TTGCCATTAA TTCAGCGAGT GAATGGAAAA GTGGCACTCG CATCGGCATC GCGCTATAAC 
GCATGGCGAT TGCCCTCTAA TAAAGTTAAG CATCGCTATC AACAGCAAGG ATATCAATGG 
CTTGATACTC CACATCAGGG TCAAGTGACG GTCAATTTTT CAGCGCAAGG CTGGCGGATT 
AGCAGCCTCA GAGAGCAAAT TTTACCTCGT TGGTATCATC AGTGGTTTGG CGTGCCAGTG 
GATAACGGGT AG

Protein sequence

MHLSGPLILE QGLWFLADRS LALLFWGLKS LPEGWINIAE RWQWLSFSPW FLLVVWRLNV 
WRTLPAMCVA VGLLMCWPLW QKPRPDEWQV YMLDVGQGLA MVIARNGKAI LYDTGLAWPE 
GDSGQQLIIP WLHWHNLEPE GVILSHEHLD HRGGLDSILH TWPMLWIRSP LNWEHHQPCV 
RGEAWQWQGL RFSVHWPLQA SNDKGNNHSC VVKVYDGTNS ILLTGDIEVP AEQKMLSRYW 
QQVQTTLLQV PHHGSNTSSS LPLIQRVNGK VALASASRYN AWRLPSNKVK HRYQQQGYQW 
LDTPHQGQVT VNFSAQGWRI SSLREQILPR WYHQWFGVPV DNG