Gene YpsIP31758_4037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_4037
Symbol
ID	5386169
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	4547415
End bp	4548743
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	43%
IMG OID	640867067
Product	metalloprotease
Protein accession	YP_001402983
Protein GI	153948040
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2931] RTX toxins and related Ca2+-binding proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	62
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTACT CCAGGGAACA CCGCAACACT ATAATTAAAA ATGAACATGT CATGCGCAGA 
GGCATTCATT ATAAGAATGA AATTAAAGGT GTTATAGCAC CACAAATATC TAGCCATCAG 
TCATGGAAAG AAAACACTAT TCATAATAAA AATACAAACC TGACATATTC ATTTAGTCGA 
GCATATACAT TATGGGATTA TGATCGAACG TTCCAACAAA ACGCTTATGT CTCATTATTT 
AATCCAGCCC AAATCCATCA GGCAAAAATC GCGATGCAAT CTTGGGCTGA TGTAGCCAAC 
ATCTCCTTCA CCGAAGCATC AGCAGACTCT TCCGCCAATA TTCTATTTTT AAATTTTCAG 
CGCCCAGGCA ATGTGGCAGG TTATGCCTAT CATCCTAATC TAGGGAGTTT CAGCCCAATA 
TGGATTAATT ACAGCTTCAG CGATAACCAA CATCCCAGCA GATTAAATTA TGGTGGCGGG 
GTATTAACAC ATGAGATTGG CCATGCTCTG GGGTTGGGTC ATTCTCATGC CCCCCATGGC 
TACACGCAAC AAATGAGTGT GATGAGCTAT TTATCCGAAC AGGATTCAGG CGCGAACTAT 
GGCCAACATT ACTTATCCAC GCCACAAATG TACGATATCG CCGCAATCCA GTATCTGTAT 
GGGGCTAATC TACACACCCG CACCGGTGAT ACCGTTTATG GCTTCAACTC GACGAGTTAT 
AGAGATCATT TCACCGCCAC CCACGCCAGT GATGCGTTGA TTTTCTGTGT CTGGGATGCT 
GGCGGCAATG ATACTTTTGA CTTCTCTGGC TATAAGCAAA ATCAAATGAT TAATCTTAAC 
GAACTCTGTT TTTCTGATGT TGGTGGACTA AAAGGAAATG TGTCTATTGC AGCGGATGTT 
ACGATTGAAA ATGCCATCGG CGGCAGTGGC CATGATGATA TTATCGGCAA TCACACCAAT 
AATATTTTGA CCGGTAACGG CGGATCTGAT CAACTTTGGG GTAACGGGGG CAATAATACT 
TTCCGCTATG CCAGTGCCAG AGATTCAATG ACCACCTCGC CCGATACTAT TCATGATTTT 
AAATCAGGCC GTGACAAGAT AGATTTGTCG CAATTAATGC CCTCAACCGA CCGTGTTATT 
TTTGTCGATA GATTAAGTTT TAACGGTCAA ACAGAGATGG GGCAGCAATA TAATGAAGTG 
GCGGACATAA CTTATCTTAT GATCGATTTT GACGCTCAAG TCAGCGAGTG CGATATGATG 
ATTAAATTTA CCGGCAGGCA CCATTTCACC GCCAATGACT TTATTTTAAG TACGTCACTG 
ACGGCATAA

Protein sequence

MSYSREHRNT IIKNEHVMRR GIHYKNEIKG VIAPQISSHQ SWKENTIHNK NTNLTYSFSR 
AYTLWDYDRT FQQNAYVSLF NPAQIHQAKI AMQSWADVAN ISFTEASADS SANILFLNFQ 
RPGNVAGYAY HPNLGSFSPI WINYSFSDNQ HPSRLNYGGG VLTHEIGHAL GLGHSHAPHG 
YTQQMSVMSY LSEQDSGANY GQHYLSTPQM YDIAAIQYLY GANLHTRTGD TVYGFNSTSY 
RDHFTATHAS DALIFCVWDA GGNDTFDFSG YKQNQMINLN ELCFSDVGGL KGNVSIAADV 
TIENAIGGSG HDDIIGNHTN NILTGNGGSD QLWGNGGNNT FRYASARDSM TTSPDTIHDF 
KSGRDKIDLS QLMPSTDRVI FVDRLSFNGQ TEMGQQYNEV ADITYLMIDF DAQVSECDMM 
IKFTGRHHFT ANDFILSTSL TA