Gene SbBS512_E0979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E0979
Symbol
ID	6271978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	902152
End bp	903414
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	56%
IMG OID	641725129
Product	site-specific recombinase, phage integrase family protein
Protein accession	YP_001879655
Protein GI	187730111
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000000000444866
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTTTAA ACGATTCTAA AATCCGCAAG TTAAAACCTT CTTCCCGTCC GGTAAAACTC 
TCCGACGCTC ACGGTCTGTA TCTGCTCGTC AATCCGGGCG GTTCACGCAT CTGGTATCTC 
AAATATCGTT TCAACGGAAA AGAATCCAGA GTCAGTCTTG GCGCATACCC GCTGGTCTCA 
CTGGCAGAAG CCAGGCAACA GCGCGACGGT ATCCGCAAGC TACTGGCGCA GAATATCAAC 
CCGGCGCAAC AGCGCATGGC AGAGAAATCC GCCTGCTCCC CTGAAAAGTG TTTTAAGGCG 
GTGGCGCTGG CCTGGCACAA AACCAACAAA AAATGGTCGG CTGATTATGC CGCCCGTATT 
CTCGCCAGTA TGGAAAACCA TATCTTCCCG GCGGTTGGTC ACCTGCCCGT TGCTGCGCTT 
AAAACGCAGG ATTTCACGGC TTTGTTGCGG GTTATCGAGA ATAAAGGCTT TCTGGAAGTC 
GCGTCCCGAA CCCGGCAGCA ACTCAGCAAC ATCATGCGCT ATGCCGTTCA GCAGGGACTT 
ACCGACAGTA ATCCGGCGCA GCATCTGGAA GGTGTAACTG CCTCCCCCGT CAAGAATCAC 
TATCCCGCTT TACCGCTGGA GCGATTGCCT GAACTGCTTG ACCGCATTGG CGACTACCGG 
CAGGGCCGGG AGTTAACCCG GCTGGCGGTG GTGCTGACGT TGCACCTGTT CATCCGTTCC 
AGCGAACTGC GTTTCGCCCG CTGGAGTGAG ATTGATTTCA GGCACAAAAT CTGGACCATC 
CCCGCAACCC GCGAGGCCAT TGATAAAGTA CGGTTTTCGG GGCGTGGCGC AAAAATACGC 
ACCCCGCATA TCGTACCGCT CTCCTGCCAG GCGATTGCCA TTCTGAAACA GATACAGGAG 
CTTTCCGGCC ATCTGGATCT GGTGTTTCCC GGCGACCATA ATCCGTACAA GCCAATGAGC 
GAAAACACCA CCAACCGGGC GCTGCGTCTG ATGGGGTATG ATACGAAAAC TGAAATCTGC 
GGGCATGGAC TCAGGGCAAT GGCCTGTAGC GCCCTGGTGG AGTCGGATCT GTGGTCACGC 
GATACAGTGG AGCGGCAAAT GAGCCACCAG GAGCGCAACA GCGTGCGTGC GGCATATGTG 
CATAAGGCGG AGCATCTGGA GGCCCGAAAG GCCATGATGC AGTGGTGGTC GGATTATCTG 
GATGTGTGCC GCGAGGGGTA TGTCGCGCCG TACATTTATG CGCGGCAGCA TGAGGCAGCC 
TGA

Protein sequence

MFLNDSKIRK LKPSSRPVKL SDAHGLYLLV NPGGSRIWYL KYRFNGKESR VSLGAYPLVS 
LAEARQQRDG IRKLLAQNIN PAQQRMAEKS ACSPEKCFKA VALAWHKTNK KWSADYAARI 
LASMENHIFP AVGHLPVAAL KTQDFTALLR VIENKGFLEV ASRTRQQLSN IMRYAVQQGL 
TDSNPAQHLE GVTASPVKNH YPALPLERLP ELLDRIGDYR QGRELTRLAV VLTLHLFIRS 
SELRFARWSE IDFRHKIWTI PATREAIDKV RFSGRGAKIR TPHIVPLSCQ AIAILKQIQE 
LSGHLDLVFP GDHNPYKPMS ENTTNRALRL MGYDTKTEIC GHGLRAMACS ALVESDLWSR 
DTVERQMSHQ ERNSVRAAYV HKAEHLEARK AMMQWWSDYL DVCREGYVAP YIYARQHEAA