Gene SbBS512_E4229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4229
Symbol
ID	6270559
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3954189
End bp	3955388
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	57%
IMG OID	641728049
Product	IS1294, transposase
Protein accession	YP_001882470
Protein GI	187730874
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGTCCG CTTTTACTCC CCGCCCGCTG AAACGTCTGT TCACGGCCAA CCAGTGCTGG 
ACATCCTTCC TGGATGCGGG CGGTCTGCGC GATATCGGGG TTGAGGCTGT CACAAAAATG 
CTGGCCTGCG GCACGCGGAT ACTGGGAGTG AAGGAATACA TCTGCGATAA ACCTGAGTGC 
CCCCACGTCA GATACGTCAC TAACTCATGC GGCAGCCGTG CCTGCCCGTC CTGCGGAAAA 
AAGGCCACAG ACCTGTGGAT AGCGACACAG CTGAATCGTC TTCCTGACTG CGACTGGGTA 
CACCTGGTCT TCACCCTGCC GGACACGCTG TGGCCGGTGT TCGAAAGCAA CCGGTGGCTG 
CTGAATGACG TGTGCCGTCT GGCGGTGGAG AATCTGCTGT ATGCCGCCCG GAAACGGGGG 
CAGGAACCCG GTATCTTCTG CGCCATCCAC ACGTATGGCC GTCGTCTCAA CTGGCATCCG 
CATGTACATG TGTCTGTAAC CTGTGGAGGT CTGAATAAGC ATGGTCAGTG GAAAAAGCTG 
AGCTTCCTGA AAGACGCGAT GCGTTCACGG TGGATGTGGA ATATGCGGCA GCTGCTTCTG 
AAAGCGTGGT CAGAGGGGCT GGCGATGCCG GAGTCGTTGT CACATATCAC GACGGAATCA 
CAGTGGAGAA GCCTGGTGCT GAAAGCCGGA GGAAAATACT GGCATGTGTA CATGTCGAAA 
AAAACGGCCG GCGGGAGGAA TACGGCGCGC TACCTGGGTC GTTATCTGAA GAAGCCGCCG 
ATAGCGGCCT CCCGGCTGGC ACATTACAAC GTAGGGGCGA GCCTGAACTT CCGTTACCTG 
GACCACAAAA CGGGAGAAAC GGCGACGGAA ACGCTGACAC AGCGTGAGCT GGTCGCGAGG 
CTGAAACAGC ACATCCCGGA GAAGTTTTTT AAGATGGTGA GGTACTTCGG GTTCCTTGCC 
AACCGGGTGT GTGGAGAGAA GCTGCCGCAG GTGTACCGTG CTCTGGGGAT GGATAAACAG 
GAACCAGTGG CGAAAGTGTG CTATGCACAA ATGGTGAAAC AGTTCCTGAG TCGTGACCCG 
TTCGAATGCG TGCTGTGTGG CGGCCGGATG GTATACCGCC GGGCCATCGC GGGACTGAAT 
GTGGAGGGGC TGAAGAAAAA CGCGCGGGAT ATCAGTCTGC TGAGGTATAT GCCGGCCTGA

Protein sequence

MLSAFTPRPL KRLFTANQCW TSFLDAGGLR DIGVEAVTKM LACGTRILGV KEYICDKPEC 
PHVRYVTNSC GSRACPSCGK KATDLWIATQ LNRLPDCDWV HLVFTLPDTL WPVFESNRWL 
LNDVCRLAVE NLLYAARKRG QEPGIFCAIH TYGRRLNWHP HVHVSVTCGG LNKHGQWKKL 
SFLKDAMRSR WMWNMRQLLL KAWSEGLAMP ESLSHITTES QWRSLVLKAG GKYWHVYMSK 
KTAGGRNTAR YLGRYLKKPP IAASRLAHYN VGASLNFRYL DHKTGETATE TLTQRELVAR 
LKQHIPEKFF KMVRYFGFLA NRVCGEKLPQ VYRALGMDKQ EPVAKVCYAQ MVKQFLSRDP 
FECVLCGGRM VYRRAIAGLN VEGLKKNARD ISLLRYMPA