Gene SbBS512_E0814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E0814
Symbol
ID	6269363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	765129
End bp	766286
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	54%
IMG OID	641724989
Product	hypothetical protein
Protein accession	YP_001879516
Protein GI	187732333
COG category	[S] Function unknown
COG ID	[COG2311] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCGCA ACGTAACGCT CGATTTTGTT CGCGGCGTCG CCATTCTGGG GATCCTGCTA 
TTAAACATCA GCGCCTTTGG GCTACCAAAG GCGGCTTATC TCAATCCCGC TTGGTACGGC 
GCTATTACGC CGCAGGATGC ATGGACCTGG GCATTTCTCG ATCTCATCGG CCAGGTGAAA 
TTCCTCACGC TTTTTGCGCT GCTGTTTGGT GCGGGCCTGC AAATGTTGCT GCCCCGTGGC 
AGACGCTGGA TCCAGTCGCG GTTAACGCTG TTAGTCTTGC TGGGTTTTAT TCACGGTTTA 
TTGTTCTGGG ACGGCGATAT TCTGCTGGCT TACGGGCTGG TGGGCTTAAT CTGCTGGCGG 
CTGGTGCGCG ATGCGCCATC GGTAAAAAGC CTGTTTAATA CAGGCGTCAT GCTTTATCTG 
GTGGGGCTTG GCGTTTTGCT GTTATTGGGG CTGATTTCCG ACAGCCAGAC CAGCCGCGCC 
TGGACGCCGG ATGCATCGGC TATTTTGTAT GAAAAATACT GGAAGCTTCA CGGCGGCGTT 
GAAGCAATCA GTAATCGTGC CGATGGTGTT GGCAACAGTT TACTGGCACT GGGCGCACAG 
TATGGCTGGC AACTGGCAGG GATGATGCTC ATTGGTGCGG CGCTGATGCG CAGCGGCTGG 
CTGAAAGGGC AGTTCAGCTT ACGTCACTAT CGTCGTACTG GTTTTGTGCT GGTGGCGATT 
GGGGTGACTA TTAACCTTCC TGCCATCGCC CTGCAATGGC AGCTGGACTG GGCGTATCGC 
TGGTGTGCCT TCTTACTTCA AATGCCGCGG GAACTGAGTG CGCCGTTTCA GGCGATTGGC 
TATGCGTCGC TGTTTTATGG CTTCTGGCCG CAATTGAGCC GCTTTAAGCT GGTGCTTGCG 
ATCGCCTGCG TCGGACGGAT GGCGCTGACC AACTATCTAT TGCAAACGCT GATTTGTACC 
ATGCTTTTTT ACCACCTCGG TTTGTTTATG CATTTTGACC GCCTGGAGCT GCTGGCGTTT 
GTTATTCCGG TATGGCTGGC GAATATCCTC TTCTCTGTTA TCTGGCTGCG TTACTTCCGC 
CAGGGGCCGG TGGAATGGCT CTGGCGTCAG TTAACTTTGC GTGCTGCCGG AACGGCAATA 
TCTAAAACAT CAAGATAA

Protein sequence

MERNVTLDFV RGVAILGILL LNISAFGLPK AAYLNPAWYG AITPQDAWTW AFLDLIGQVK 
FLTLFALLFG AGLQMLLPRG RRWIQSRLTL LVLLGFIHGL LFWDGDILLA YGLVGLICWR 
LVRDAPSVKS LFNTGVMLYL VGLGVLLLLG LISDSQTSRA WTPDASAILY EKYWKLHGGV 
EAISNRADGV GNSLLALGAQ YGWQLAGMML IGAALMRSGW LKGQFSLRHY RRTGFVLVAI 
GVTINLPAIA LQWQLDWAYR WCAFLLQMPR ELSAPFQAIG YASLFYGFWP QLSRFKLVLA 
IACVGRMALT NYLLQTLICT MLFYHLGLFM HFDRLELLAF VIPVWLANIL FSVIWLRYFR 
QGPVEWLWRQ LTLRAAGTAI SKTSR