Gene SbBS512_E1554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1554
Symbol
ID	6270900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	1416633
End bp	1418030
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	55%
IMG OID	641725648
Product	hypothetical protein
Protein accession	YP_001880154
Protein GI	187732603
COG category	[R] General function prediction only
COG ID	[COG3106] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCGAC TTAAAAATGA ACTTAATGCG CTGGTGAATC GGGGTGTCGA CAGACATCTG 
CGCCTCGCCG TAACCGGACT AAGCCGCAGC GGCAAAACAG CGTTTATCAC TGCGATGGTC 
AATCAGTTGC TCAATATTCA CGCCGGAGCA CGCTTGCCGC TGTTAAGCGC GGTGCGTGAA 
GAGCGCCTGC TGGGCGTAAA ACGCATTCCT CAGCGTGACT TTGGCATTCC GCGCTTCACA 
TATGATGAAG GACTGGCGCA GTTATACGGC GATCCTCCCG CCTGGCCGAC GCCAACGCGC 
GGCGTCAGTG AAATCCGCCT GGCGCTACGT TTTAAATCGA ACGATTCGCT GCTACGCCAC 
TTCAAGGACA CCTCCACGCT GTATCTGGAG ATTGTGGATT ATCCCGGCGA ATGGTTGCTC 
GACCTGCCGA TGCTGGCGCA GGACTATTTA AGCTGGTCAC GCCAGATGAC GGGCTTACTC 
AATGGTCAGC GCGGCGAATG GTCGGTCAAA TGGCGAATGA TGTGCGAAGG GCTGGACCCG 
CTAGCACCTG CCGACGAAAA CCGGCTGGCA GACATTGCCG CCGCGTGGAC CGATTATCTC 
CACCACTGTA AACAGCAGGG GCTGCACTTT ATTCAGCCAG GGCGCTTTGT CTTGCCAGGA 
GATATGGCAG GTGCGCCCGC GCTGCAATTC TTCCCGTGGC CGGATGTCGA TACCTGGGGC 
GAGTCCAAAC TGGCGCAGGC CGATAAGCAC ACCAATGCCG GAATGCTGCG CGAGCGGTTT 
AATTATTACT GCGAGAAGGT GGTGAAGGGG TTCTATAAGA ATCATTTTCT GCGCTTTGAC 
CGCCAGATTG TGCTGGTTGA TTGCCTGCAA CCTCTCAACA GTGGGCCACA GGCATTTAAT 
GATATGCGTC TGGCACTGAC GCAGCTGATG CAAAGTTTCC ACTACGGGCA GCGTACCTTG 
TTCCGGCGTT TGTTTTCGCC GGTTATCGAT AAGCTATTGT TTGCTGCCAC TAAAGCGGAC 
CATGTGACCA TCGATCAGCA CGCCAATATG GTTTCATTAC TGCAACAACT GATTCAGGAT 
GCCTGGCAAA ATGCGGCGTT TGAAGGGATT AGTATGGATT GTCTGGGGCT GGCCTCGGTG 
CAGGCGACCA CCAGCGGCAT TATTGACGTC AACGGCGAGA AAATTCCGGC ATTGCGCGGT 
AACCGGCTCA GCGATGGTGC GCCACTCACC GTTTATCCCG GTGAAGTTCC TGCGCGTTTG 
CCCGGTCAGG CGTTCTGGGA CAAACAAGGG TTCCAGTTTG AAGCGTTTCG CCCGCAGGTG 
ATGGATGTCG ACAAACCGCT GCCGCATATT CGTCTTGATG CCGCGCTGGA ATTTTTAATA 
GGAGATAAAT TGCGATGA

Protein sequence

MKRLKNELNA LVNRGVDRHL RLAVTGLSRS GKTAFITAMV NQLLNIHAGA RLPLLSAVRE 
ERLLGVKRIP QRDFGIPRFT YDEGLAQLYG DPPAWPTPTR GVSEIRLALR FKSNDSLLRH 
FKDTSTLYLE IVDYPGEWLL DLPMLAQDYL SWSRQMTGLL NGQRGEWSVK WRMMCEGLDP 
LAPADENRLA DIAAAWTDYL HHCKQQGLHF IQPGRFVLPG DMAGAPALQF FPWPDVDTWG 
ESKLAQADKH TNAGMLRERF NYYCEKVVKG FYKNHFLRFD RQIVLVDCLQ PLNSGPQAFN 
DMRLALTQLM QSFHYGQRTL FRRLFSPVID KLLFAATKAD HVTIDQHANM VSLLQQLIQD 
AWQNAAFEGI SMDCLGLASV QATTSGIIDV NGEKIPALRG NRLSDGAPLT VYPGEVPARL 
PGQAFWDKQG FQFEAFRPQV MDVDKPLPHI RLDAALEFLI GDKLR