Gene YpsIP31758_1779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_1779
Symbol
ID	5384972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	2056191
End bp	2057471
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	50%
IMG OID	640864762
Product	hypothetical protein
Protein accession	YP_001400754
Protein GI	153948117
COG category	[S] Function unknown
COG ID	[COG4950] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01926] uncharacterized peroxidase-related enzyme

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGCAAT TTCGCAGGAG AAATAATGCC CATTGGTATC ATGAGACTCA GTGTAGCGGC 
AGCCTGGAGC ATTGTAGCGG TAGCCCAGTG AATATTTCCA CGACAGTGAA TGTTCCCACG 
ACAGTGAATA ATGAAAACCC CCCTGTTGAT ATTCGGCCAC GTGATCCCAG CGAGAGTGAC 
AACATGAGCA CTGGCAGTAA TATAACTGAA CAGAGCATCA TAACTGAACA GGGCATCTTT 
CTACTTGGCG TGACAGAAAA CATCGCTCCT ACATTACAAG ACACCCTCTA CCATGAGCAG 
CCTATTCTTA CTGCCTCCGA CGCCATGTAT CAGGCCCTGT TCCCAACGAT TATCGAGATC 
AACCACACCA ATACCTTCTC ACTTTATGAT CGGTTAAGTA CTGCGCTGAC GGTCGCTCAG 
GTTACCGGGA TTCAGCGGCT ATGTAGCCAC TATGCTCTCC GTCTCGCGCC GCTCCCCAGC 
CCGGATGCCT CAAGGGAAAG CAATATTAGG CTAACGCAAA TTACGCAATA TGCCCGCCAA 
TTGGCCAGCC AACCTACGTT GATCGATAGG CATGCTTTAG CGCAATTGCA TGACGTGGGT 
TTAACTGATA GCGATATCAT TATTTTATCG CAAATTATTG GATATGTGGG ATATCAAGCC 
CGAGTGGTCG CTGGCATCTC TGCACTGGCT GGTTACCCTA CCGTGATGCT CCCCGGTTTC 
CCCCGCATGG AAGATGCCGC CCCCAACCCA TTACCAGATG TCATGCCCAA TTGGCAAGGT 
TGGCTACCGT CTCATGCGGC AAACGACGAT CAATCCGATA AAGAACCTGA CGAAACGGCC 
AGCACACTGA CTGAACTGTT GGGCCATCAC CAGCAAAGTT TGCTCGCTTA TCACGCCATT 
ACCACTCACC AGCCCAACTC ACCTCAATTG CAACGTGACT GGCTGGAACT GGTGGCATTG 
GTCAGCGCAC GAATCAATGG CAGCCTCTAC TGCCAAGCCC GTCACAGGCA ACATTTACAG 
CAACTGACGG AGCAGCCCCT GTTGGTCACT GAGCTGTTAA AAGGGATTGA TCACGCGTTA 
TTCTTGTTAC CCGAACAACA AATACCCCAT CAGCTAATCA GTGTAACCGC CGAGCTCACT 
CGCGCCCCGG AACGCTTTAA TCATCAGCAT GTTAAACGTC TACAGACCCT TGGCGTCAGT 
GATACTCAAG TCATGCGTAT TATTTTCAGT ATCGCCATTA CTGGTTGGAC CAACCGCCTA 
CGACATACGT TAGGAAAATA G

Protein sequence

MVQFRRRNNA HWYHETQCSG SLEHCSGSPV NISTTVNVPT TVNNENPPVD IRPRDPSESD 
NMSTGSNITE QSIITEQGIF LLGVTENIAP TLQDTLYHEQ PILTASDAMY QALFPTIIEI 
NHTNTFSLYD RLSTALTVAQ VTGIQRLCSH YALRLAPLPS PDASRESNIR LTQITQYARQ 
LASQPTLIDR HALAQLHDVG LTDSDIIILS QIIGYVGYQA RVVAGISALA GYPTVMLPGF 
PRMEDAAPNP LPDVMPNWQG WLPSHAANDD QSDKEPDETA STLTELLGHH QQSLLAYHAI 
TTHQPNSPQL QRDWLELVAL VSARINGSLY CQARHRQHLQ QLTEQPLLVT ELLKGIDHAL 
FLLPEQQIPH QLISVTAELT RAPERFNHQH VKRLQTLGVS DTQVMRIIFS IAITGWTNRL 
RHTLGK