Gene SbBS512_E3614 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3614
Symbol
ID	6270808
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3367006
End bp	3367986
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	58%
IMG OID	641727483
Product	peptidase, U32 family
Protein accession	YP_001881925
Protein GI	187732504
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCTGC TCTGCCCTGC CGGAAATCTC CCGGCGCTTA AGGCGGCCAT CGAAAACGGC 
GCAGATGCTG TTTATATCGG GCTAAAAGAT GATACCAATG CCCGTCACTT CGCCGGCCTT 
AACTTTACCG AGAAAAAATT GCAGGAAGCG GTGAGTTTTG TCCATCAACA TCGCCGCAAA 
CTTCACATCG CGATTAACAC TTTTGCGCAT CCGGACGGTT ACGCCCGTTG GCAGCGCGCC 
GTGGATATGG CGGCGCAGCT GGGTGCCGAC GCGCTGATCC TCGCCGACCT CGCCATGCTG 
GAATACGCCG CCGAGCGTTA TCCGAATATT GAGCGCCACG TATCGGTGCA GGCTTCGGCG 
ACCAATGAAG AGGCGATTAA CTTTTATCAT CGCCATTTTG ACGTTGCCCG CGTGGTGCTG 
CCGCGCGTGT TGTCGATTCA TCAGGTGAAA CAGCTGGCAC GGGTCACACC TGTACCACTG 
GAAGTGTTTG CTTTCGGCAG CCTGTGCATT ATGTCGGAAG GCCGTTGCTA TCTGTCGTCG 
TATCTGACGG GTGAGTCGCC TAACACCGTG GGCGCGTGTT CTCCGGCCCG TTTCGTGCGC 
TGGCAACAAA CGCCGCAGGG GCTGGAATCC CGCCTGAACG AAGTGCTGAT CGACCGTTAT 
CAGGACGGCG AAAACGCAGG TTATCCGACG CTGTGTAAAG GGCGTTATCT GGTGGACGGC 
GAGCGCTATC ACGCGCTGGA AGAACCAACC AGTCTCAATA CCCTGGAACT GCTGCCGGAG 
TTAATGGCGG CGAATATTGC TTCGGTGAAA ATTGAAGGCC GCCAGCGTAG CCCGGCGTAT 
GTCAGCCAGG TGGCGAAAGT CTGGCGTCAG GCTATCGACC GTTGTAAGGC CGATCCGCAA 
AGCGCGTGGA TGGAGACGCT CGGGTCGATG TCCGAAGGCA CGCAGACCAC CCTTGGCGCG 
TATCACCGTA AATGGCAGTG A

Protein sequence

MELLCPAGNL PALKAAIENG ADAVYIGLKD DTNARHFAGL NFTEKKLQEA VSFVHQHRRK 
LHIAINTFAH PDGYARWQRA VDMAAQLGAD ALILADLAML EYAAERYPNI ERHVSVQASA 
TNEEAINFYH RHFDVARVVL PRVLSIHQVK QLARVTPVPL EVFAFGSLCI MSEGRCYLSS 
YLTGESPNTV GACSPARFVR WQQTPQGLES RLNEVLIDRY QDGENAGYPT LCKGRYLVDG 
ERYHALEEPT SLNTLELLPE LMAANIASVK IEGRQRSPAY VSQVAKVWRQ AIDRCKADPQ 
SAWMETLGSM SEGTQTTLGA YHRKWQ