Gene YpsIP31758_1606 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_1606
Symbol
ID	5386681
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	1864959
End bp	1866080
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	48%
IMG OID	640864587
Product	cupin family protein
Protein accession	YP_001400583
Protein GI	153947083
COG category	[S] Function unknown
COG ID	[COG2850] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTACC AACTCGATCT CGATTGGCCT GACTTTCTAC AACGCTATTG GCAAAAGCGC 
CCTGTTATCC TCAAACGTGG CTTCAAAAAT TTTATTGACC CACTCTCCCC AGATGAACTT 
GCCGGGTTAG CCATGGAAAA TGAAGTCGAT AGCCGCTTGG TAAGCCATGA AAATGGGCGT 
TGGCATGTTA GCCACGGGCC ATTTGAAAGC TTTGATCATT TAGGTGAAAA CAACTGGTCA 
TTGTTAGTTC AGGCGGTAGA CCATTGGCAT GAACCCGCAG CGGCGCTAAT GCGCCCTTTC 
CGTTCACTCT CTGACTGGCG TATGGATGAT TTAATGATCT CCTTCTCCGT GCCTGGCGGT 
GGTGTTGGGC CTCATTTTGA TCAATATGAT GTTTTTATTA TTCAGGGTTC AGGTCGTCGC 
CGCTGGCGGG TGGGCGAAAA AACTGAAATG AAACAACATT GCCCGCACCC AGATTTGCTC 
CAAGTGGGGC CTTTCGACGC TATCATTGAT GAAGAAATGG AGCCAGGTGA TATTCTTTAT 
ATTCCACCGG GCTTCCCTCA TGAAGGCTAT TCCCTTGAAA ATGCGCTGAA TTATTCCGTT 
GGTTTCCGCG CCCCAAGTGG TCGAGAACTG GTCAGTGGTT TTGCGGATTA TGTATTGGCT 
CGAGAACTGG GTAGCTATCG TTATAGCGAT CCAGATTTAC AGCTACGCGA GCATCCAGCC 
GAAGTATTAC CGTCCGAAGT TGATAAATTG CGCACAATGA TGCTGGATCT GGTCCAGCAA 
CCTGAACATT TCCAAAACTG GTTTGGTGAA TTTATTTCCC AATCACGCCA TGAGTTGGAT 
ATTGCACCGC CGGAGCCGCC TTATCAGACC GGCGATATCT ATGAACTATT GAAGCAAGGC 
GATGAATTAC AACGCCTTAG TGGATTACGG GTTCTGCGGG TTGGTGATCG TTGCTTTGCT 
AATGGTGAGT TGATTGATAC GCCACACTTA CAGGCCGCCA ATGCACTGTG CCAGCATTTT 
AGCGTGAATG CAGAGATGTT GGGTGATGCA CTTGAAGACC CTTCTTTCCT GGCAATGCTT 
GCAGCACTGG TCAATAGCGG TTATTGGTAT TTTAACGACT GA

Protein sequence

MDYQLDLDWP DFLQRYWQKR PVILKRGFKN FIDPLSPDEL AGLAMENEVD SRLVSHENGR 
WHVSHGPFES FDHLGENNWS LLVQAVDHWH EPAAALMRPF RSLSDWRMDD LMISFSVPGG 
GVGPHFDQYD VFIIQGSGRR RWRVGEKTEM KQHCPHPDLL QVGPFDAIID EEMEPGDILY 
IPPGFPHEGY SLENALNYSV GFRAPSGREL VSGFADYVLA RELGSYRYSD PDLQLREHPA 
EVLPSEVDKL RTMMLDLVQQ PEHFQNWFGE FISQSRHELD IAPPEPPYQT GDIYELLKQG 
DELQRLSGLR VLRVGDRCFA NGELIDTPHL QAANALCQHF SVNAEMLGDA LEDPSFLAML 
AALVNSGYWY FND