Gene YpsIP31758_4070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_4070
Symbol	bcsZ
ID	5385679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	4586251
End bp	4587366
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	50%
IMG OID	640867098
Product	endo-1,4-D-glucanase
Protein accession	YP_001403014
Protein GI	153950370
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3405] Endoglucanase Y
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCGTCA TGTTTAAACA CTTAGCCAGC ATGTTCCTGT TGCTGGCCAG TTTTAGTCTC 
GCAGCCGCCA GTAACTGGCC CGCGTGGCAA CAGTTCAAAC AAGATTACAT CAGTGAAGGG 
GGGCGGATCA TTGACCCCGG TAGCCCCTCG AAAATAACCA CCTCGGAAGG CCAGAGTTAT 
GGGCTTTTTT TTGCATTGGT TGCGGATGAT CAGCCGATGT TTGAGCGTTT ATTGGCTTGG 
ACAGAAAACA ATCTGGCAGC CGGTGATCTC ACTTCCCGCC TTCCCGCTTG GTTATGGGGG 
CAAAACTCAC AAAATAACTG GGATATTCTG GACCCTAATT CGGCCTCCGA TGCGGATATC 
TTGATTGCCT ACAACTTGCT GGAGGCTGGC AGGTTATGGG GTAACCGCCG TTACCTGATT 
ATGGGTACCT TATTACTGCA ACGTATTGCG CAAGAAGAAG TCATGGATAT TCCCGGCCTT 
GGCCAGATGC TATTACCGGG AAAAATTGGT TTTAACGATG AGGATACCTG GCGTCTCAAC 
CCAAGTTATT TACCGCCACA ACTACTGGCA CGATTTTCCT CCATAGACGG GCCTTGGGAA 
GCGATGGTAG AAGTGAATCA GCGTATGTGG CTGGAAACCG CACCAAACGG TTTTTCGCCG 
GACTGGGTGG TCTGGCAGAA AGGTAAAGGC TGGCAGCCCG ATACCATAAA ACCGGATGTC 
GGCAGTAACG ATGCCATTCT GGTTTATCTG TGGGCGGGGA TGCTGGCAAT GGACAGCCCA 
CAAAAAGCTG AATTGATTGC GCGTTTTCAG CCAATGGCGG TAATCACTCA GCAGCAAGGC 
CTGCCACCGT TTACGACCAA CAGCGACAAT GGTAAAACTA ACGGGGATGG GTCAGTGGGT 
TTTTCTGCGG CATTATTGCC CTTTTTAGCC AGCAGCCCAG AGCCATTTAA TCAGCAAACA 
CTGAATCTCC AACAGCGACG GGTACAAAAT TCACCGCCTG GCGCTGATGA TTATTACAGT 
GCTATTCTGA CCCTGTTTGG TCAGGGGTGG TTACAGCATC GTTATCATTT TACCCATCAG 
GGAGAGCTAC AGCCCTCATG GCACCGTCAA CGTTAA

Protein sequence

MVVMFKHLAS MFLLLASFSL AAASNWPAWQ QFKQDYISEG GRIIDPGSPS KITTSEGQSY 
GLFFALVADD QPMFERLLAW TENNLAAGDL TSRLPAWLWG QNSQNNWDIL DPNSASDADI 
LIAYNLLEAG RLWGNRRYLI MGTLLLQRIA QEEVMDIPGL GQMLLPGKIG FNDEDTWRLN 
PSYLPPQLLA RFSSIDGPWE AMVEVNQRMW LETAPNGFSP DWVVWQKGKG WQPDTIKPDV 
GSNDAILVYL WAGMLAMDSP QKAELIARFQ PMAVITQQQG LPPFTTNSDN GKTNGDGSVG 
FSAALLPFLA SSPEPFNQQT LNLQQRRVQN SPPGADDYYS AILTLFGQGW LQHRYHFTHQ 
GELQPSWHRQ R