Gene YpsIP31758_3422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_3422
Symbol
ID	5384334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	3854136
End bp	3855746
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	51%
IMG OID	640866435
Product	hypothetical protein
Protein accession	YP_001402377
Protein GI	153950101
COG category	[S] Function unknown
COG ID	[COG3455] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03349] type IV / VI secretion system protein, DotU family

Plasmid Coverage information

Num covering plasmid clones	61
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGAAT TTGAACGCCA GATCCGTGCA GCCATTTCCG CAGCACGCAA TGGCGCAAAA 
CATGCGGAAC AGTCACTGAC TACACCAATG TGGCAAGCCA AAAGCACCGT AGCCTCATTG 
GGTGGGATTG TCCCTAGAAG TGGCTCTTCG TCAACGTCAC AGGCGGAGAA CTATAAGGAA 
GATCTCGCGG ACCAGGCTGC CTCGGGCAAC AACATGGCGC GCACGAGTGC GCCACCGGTC 
ACTTTGTATC AGCAACAGCC AAATGCGAAT GACAGCTATC CAAACGGGAA TAACAACAAT 
CCAAACGGGG ATAACAACAA TCCAAACGGG AGTAACAACA ATATAGCGAG AGTACAGCGT 
ATGCCGCATG GCATTTCCAG GGGCTTATAT GAGCGCCCTG GGATGTTATT GGGTGCCTGG 
GATAACGCCT ATATTGCTGC GGCTATGCCT TTGCTGCTGC TGGTGGAAAA TATTCGTAGC 
TGGCCGACGC GTAACGCCGC AGAGGTCAGG CCACCGATTG TGCGGGAATT ACAATATTTC 
CAGCAACATT TGCAGAAAAA GAACTACCCG CAAGAAGACA TTAACCACCT GTCTTACCTG 
CTATGTACCT ATATCGATGG CATTTTTAAC GGGCTGCAAA CCCCAGACTC CTACAACCAA 
AGTCTGTTAG TGGAGTTTCA TCGTGATGCC TGGGGGGGTG AGGACTGCTT CGAACATCTG 
CGGGTCTATA TGAACTCGCC GAAACAGTAC CGGGAAGTTC TGGAATTCTA TGATCTGATT 
ATGTGCCTTG GTTTTGACGG TAAATACCAG ATGATAGAGC ATGGTGCGGT TCTGCTGATG 
GATTTACGCA GCCGTCTCCA CACGCAACTC TACGGTCAGG ACGCCACACA ATCTTTGGCT 
ATCGCGCAAG CGGTCAAAGG TTCTCCGCGT CGCCAATATA TCAAGGCGCT GAAAATCTTC 
ACCTATGGTT TCGCACTGTG CCTTTGTGCT TACGGCGTCA CGGCGTGGTA TCTGCACCAG 
CAATCCCAAC AGATCCGCAG CAACATTCTG ACGTGGGTAC TGCCTGAACC GCGGAAAATC 
AACATCATGG AGACCTTGCC GAATCCGCTA TCCAACATCC TGAATGAAGG GTGGCTGGAG 
GTCAGGAAAG ATCCGCGTGG ATGGCTATTA ATCTTCACCT CCGACGGCGC GTTCCGCACG 
GGTGAAGCGA CCCTCTCGGA AGAGTTTATC AACAAGAAGA ATATCGAACG TCTTGGGCTG 
GCATTAGCCC CATGGCCGGG AGATATCGAG GTTATTGGTC ATACGGATAA CAAACCGTTC 
CGTAGCACTT CCGGTAACAA CAACCTCAAA CTTTCCGCGG CCAGAGCATC GGTGGTGGCA 
GATAAACTGC GGGAATCCAC TCAAATCAAC GAAACCCATC AGCGAGAAAT AAGTGCCATC 
GGACGGGGGG AGAGCGATCC TTTAGCTGAC AATGCAACGG AAGAAGGGCG CAAGCGTAAC 
CGGCGTGTGG ATATCCTATG GAAAATTGGT CAGCGCGATG CCGATAAGGC CATGAAGCAA 
TTCCTGGAGA ACCCAACACC AGAAGTTCAA GGAACGAATA CCCAACAATA G

Protein sequence

MNEFERQIRA AISAARNGAK HAEQSLTTPM WQAKSTVASL GGIVPRSGSS STSQAENYKE 
DLADQAASGN NMARTSAPPV TLYQQQPNAN DSYPNGNNNN PNGDNNNPNG SNNNIARVQR 
MPHGISRGLY ERPGMLLGAW DNAYIAAAMP LLLLVENIRS WPTRNAAEVR PPIVRELQYF 
QQHLQKKNYP QEDINHLSYL LCTYIDGIFN GLQTPDSYNQ SLLVEFHRDA WGGEDCFEHL 
RVYMNSPKQY REVLEFYDLI MCLGFDGKYQ MIEHGAVLLM DLRSRLHTQL YGQDATQSLA 
IAQAVKGSPR RQYIKALKIF TYGFALCLCA YGVTAWYLHQ QSQQIRSNIL TWVLPEPRKI 
NIMETLPNPL SNILNEGWLE VRKDPRGWLL IFTSDGAFRT GEATLSEEFI NKKNIERLGL 
ALAPWPGDIE VIGHTDNKPF RSTSGNNNLK LSAARASVVA DKLRESTQIN ETHQREISAI 
GRGESDPLAD NATEEGRKRN RRVDILWKIG QRDADKAMKQ FLENPTPEVQ GTNTQQ