Gene SbBS512_E0767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E0767
Symbol
ID	6270701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	719456
End bp	720697
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	52%
IMG OID	641724949
Product	prophage integrase
Protein accession	YP_001879477
Protein GI	187731694
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.496617
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGAA AGGCAACCCC ACTCACCACC ACACAGATCA AAGCAGCTAA ACCAGCAGAA 
AAAGAATACA CCTTACAGGA TGGCGGCGGG CTTTTTCTCG TTATTAAGCC GTCTGGTTCG 
AAACTATGGC GATTCAACTA CTATCGACCT TCGAACAAAA AACGAACACT CATTAGTTTG 
GGATCGCTTG ATGAAGTCTC CCTTGCTGAT GCCAGAAAAC GCCGTAGCGA GTACAGGACG 
TTAATTGCGG CAGGAACCGA CCCGCAGGAA TACGAACGGC AAAAACGCGA AGCAGAGGCT 
CGACGACAGG GCAACACGTT CGAAAATGTG GCCGCATTGT GGTACGAAAT GAAAAAAAAC 
CAGAATCTCG CCCACAATAC GATCAAGGAC ATCTGGCGCT CGCTAGAGAA ATATGTATTC 
CCGTATATCG GAAACACACC GATAGATACT CTCACCGCTC GCCGCTTTGT TGAGATACTC 
ACGCCCATCA AGGCACGTGG CAACCTGGAA ACACTGAAAC GCGTTTTACA GCGCATCAAT 
GAAGTGATGG ATTTTGCTGC CAACAGTGGA ATGATTGACA TCAACACCGC CGCGAACGTT 
CGCAAGACAT TCCCTTCTCC CACCAAAAAG CACATGCCAA CCATCCGGCC GGAACAACTA 
CCGCAGCTAA TGCACGATTT ATCGATCGCC AGCATAGAAC GGCAAACCAG ATTACTGATT 
GAGTGGCAGT TGTTAACCGC AACCCGCCCA GCCGAAGCCT CTGCCGCACG GTGGGAAGAA 
ATCAACCTTG AGGCGGCAAC CTGGACGATA CCAGCCGGAC GCATGAAGAT GCGCCGTGAT 
CATGTGATCC CCCTTTGCGC TCAGGCGATG GCAGTGCTTG AAGCCATGAA GCCGATTAGC 
GCACGAAGGG AGCATGTTTT CCCAAGTCTT AAAAATCCAG TGCAACCAAT GAGCAGCCAG 
ACAGCAAACG CAGCATTACG GCGAATGGGT TACACTGGTG TGCTGGTATC TCACGGACTA 
CGCGCCATAT TCAGCACAGC GGCGAACGAA GAAGGATTTG AGCCGGACGT AATCGAGGCC 
GCACTCGCAC ACGTGGACAC GAACGAAGTT AGACGGGCAT ACAACCGAAG CAACTACCTG 
GAAAAACGTA AAGTGTTAAT GTGCTGGTGG GGTGATTTTG TGGAAGCAGC CGCAACCGGA 
ACAACCATCG CCAGCGGGCA CAGAGGATTA CGCGGAAGGT AA

Protein sequence

MARKATPLTT TQIKAAKPAE KEYTLQDGGG LFLVIKPSGS KLWRFNYYRP SNKKRTLISL 
GSLDEVSLAD ARKRRSEYRT LIAAGTDPQE YERQKREAEA RRQGNTFENV AALWYEMKKN 
QNLAHNTIKD IWRSLEKYVF PYIGNTPIDT LTARRFVEIL TPIKARGNLE TLKRVLQRIN 
EVMDFAANSG MIDINTAANV RKTFPSPTKK HMPTIRPEQL PQLMHDLSIA SIERQTRLLI 
EWQLLTATRP AEASAARWEE INLEAATWTI PAGRMKMRRD HVIPLCAQAM AVLEAMKPIS 
ARREHVFPSL KNPVQPMSSQ TANAALRRMG YTGVLVSHGL RAIFSTAANE EGFEPDVIEA 
ALAHVDTNEV RRAYNRSNYL EKRKVLMCWW GDFVEAAATG TTIASGHRGL RGR