Gene SbBS512_E1086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1086
Symbol
ID	6271624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	987183
End bp	988748
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	55%
IMG OID	641725224
Product	transposase family
Protein accession	YP_001879742
Protein GI	187731723
COG category	[L] Replication, recombination and repair
COG ID	[COG3436] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATATCT CCGCTCTCAA CACCACGAAT GACATCGAAA AACTGCGTGC TATGGCACTT 
GCCATGGTAC AAGAAGTCAT GTCGGAGAAT GCCGAAAAAG AGCGGGAATT ACTGGAGAAA 
AGCCGGCGCA TCCAGCTTCT GGAAGAAATG CTGAAACTGG TTCGTCAACA GCGCTTCGGA 
AAAAAATGTG AAACGCTGGC TGGTATGCAA CGCTCCCTAT TCGAAGAGGA TGTTGATGCC 
GATATCGCCG CGCTTACCGC ACATCTGGAT AAACTGCTCC CGCAATCCCC TGAAGAAGAT 
GAAAAAGCGT CCCGTTCACG CCCGATACGC AAACCCTTAC CGGTTCATCT TCCACGGGTG 
GAAAAAATTA TCCAGCCGGA CACTGACCAT TGCCCTGAAT GTGACGAGCC GCTGCACTAT 
ATCCGCGATG CGGTGAGTGA AAAGCTGGAG TATATTCCCG CTCACTTTGT GGTGAACCGT 
TATGTCCGTC CGCAATACAG TTGTCCCTGT TGCCAGAAGG TGTTCAGCGG TGAAATGCCG 
GCACATATCC TCCCGAAAAG TGCCGTTGAG CCATCAGTCA TCGCACAGGT GATCATCAAT 
AAATACGGTG ACCACCTGCC TCTGTATCGC CAGCAACAGG TCTTTGCCCG TTCAGATGTC 
GGGCTGCCCG TCAGTTCGAT GGCTGACATG GTTGGCGCGG CGGGTGCCGC ATTATCTCCC 
CTGGCGGCGT TACTCCATCG CGAGTTGATA AACCGTCCGG TGGTGCATGC AGATGAGACT 
ACCCTGAAGA TCCTGAACAC GAAGAAAGGC GGTAAATCCT GCTCCGGTTA TCTGTGGGCA 
TACGTCAGTG GAGAAAGGAC GGGACCGTCA GTTGTGTGCT TCGACTGCCG GACCGGACGT 
AGCCATGAGT ATCCTGAAAA CTGGCTTCAG GGCTGGGGCG GGACGCTGGT TGTCGACGGA 
CATAAAGCTT ACCGGACTCT GGCAAACAAA GTGCCGGAGA TCACGCTGGC CGGATGCTGG 
GCCCATGCCC GCAGGGGCTT CGCCGACCTG TATAAAATCA GTAAAGATCC ACGGGCTGCC 
ATAGCCGTGA AGAAAATCGC GGGGTTGTAC CGTCTTGAGA AGAAGATCAG TAGCCGCCCC 
GTGGAAAAAA TCCGCCAGTG GCGACAGCGT TATGCCCGTC CGATACTGGA AGAACTGTGG 
TCATGGCTTG AAGAGCAGGA ACCGCAATGT TCTCCGGGAA AGGCATTACA CAAAGCCATT 
GCCTATGCGC TGTCTCATCG CGTGGAACTG AGCCGCTTCC TGGAAGATGG TGCGGTGCCG 
CTGGATAATA ATGTGTGTGA ACGGGCCATC AAAAACGTGG TTCTGGGCAG AAAATCGTGG 
CTGTTCGCCG GTTCGCAGAT GGCGGGAGAA CGCGCCGCGC AAATAATGAG CTTGCTGGAA 
ACCGCGAAAC GCAACGGTCT GGAGCCGCAT GCCTGGTTGA CAGACGTCCT GATGCGTCTG 
CCGGAGTGGC CGGAGGAGCG ACTGGCAGAG TTGCTGCCTC TTGAGGGATT TACCTTCTCC 
GGGTGA

Protein sequence

MDISALNTTN DIEKLRAMAL AMVQEVMSEN AEKERELLEK SRRIQLLEEM LKLVRQQRFG 
KKCETLAGMQ RSLFEEDVDA DIAALTAHLD KLLPQSPEED EKASRSRPIR KPLPVHLPRV 
EKIIQPDTDH CPECDEPLHY IRDAVSEKLE YIPAHFVVNR YVRPQYSCPC CQKVFSGEMP 
AHILPKSAVE PSVIAQVIIN KYGDHLPLYR QQQVFARSDV GLPVSSMADM VGAAGAALSP 
LAALLHRELI NRPVVHADET TLKILNTKKG GKSCSGYLWA YVSGERTGPS VVCFDCRTGR 
SHEYPENWLQ GWGGTLVVDG HKAYRTLANK VPEITLAGCW AHARRGFADL YKISKDPRAA 
IAVKKIAGLY RLEKKISSRP VEKIRQWRQR YARPILEELW SWLEEQEPQC SPGKALHKAI 
AYALSHRVEL SRFLEDGAVP LDNNVCERAI KNVVLGRKSW LFAGSQMAGE RAAQIMSLLE 
TAKRNGLEPH AWLTDVLMRL PEWPEERLAE LLPLEGFTFS G