Gene YpsIP31758_4077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_4077
Symbol
ID	5388026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	4595913
End bp	4597304
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	37%
IMG OID	640867105
Product	putative hemagglutinin/hemolysin
Protein accession	YP_001403021
Protein GI	153949762
COG category
COG ID
TIGRFAM ID	[TIGR01731] adhesin HecA family 20-residue repeat (two copies) [TIGR01901] filamentous haemagglutinin family N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTGA CATATATTAA AACGAAACAG GGATTGTCTA TATTGCCTCT CTCTATCATA 
TTGTCGCTCT ATGGGAGTTC GGTTGCTTAT GCTGATAATA TTATTGCTGA TGTACAGGCT 
CCAATTGGAC AGCAAGCGGA AGTCTCTATT ATAAAAACGC CGCCCAGTGT ATGCCGAGCG 
CTTACCTCTT ACTGTGTCGG TATGACAGAG ACCGTCGTTA ATATTCAAGC ACCTGATGAA 
AATGGTTTAT CACATAACAA GTATTCTAAA TTTGATGTGG TCGCTAATGG CTTATTCGAT 
GTCACGACAC TGAATAATCG TTTAGCACAA GAGGTTGATG GTAACTCTTT TTTACAAGAC 
AAGTTAGCAA CCATTATATT AAATGAAGTC AATTCATCAC AGGCTAGTCT ATTAGATGGG 
AATCTCCATG TTGGTGGGCA AGATGCGCAT GTCATTATTG CTAATCCAGC GGGTATTAAT 
TGTCGAGGGT GCTCCTTTAC CAATACCTCT CATGTGACAT TGACTACCGG GGCACCATCG 
TTTAGTAACA ATAAGCTAAA TAATTTCATT GTTGAGCAGG GTAATATTAA TATTGAAAAA 
GATCCCTCTT ACTATATGAA AAGTGGCTTG CGAAATAAAA GTATGGATAC GACTTACCTT 
GATTTATTTG CGGAAAAAAT CACTGTCAAT GGTGATATCA ATGCGGACGA TGTTTATATT 
GTCACGGGAA AAAATAAAGT AGGTTTCTCT TTGCCTGGGC AACCATTGCA CGTGTCGCGT 
TTAGACAATG AAAATACACC AGTACCAGAT ACAGTTAGTT TGGATGTCAG TGAAATTGGG 
GGAATGTACG CCAATAAAAT TCGTATCTAT ACAACCGATA GCACGATTAA AAATAAGGGG 
GCAATACGCG CCAACGATAC ACTAAGCCTC AGTTCTGCAG CCAATATAGA TAACAGTAAT 
GGGAATATAT CAGGTAAAAT GGTGTTACTG AGCAGCGAGG GTGTTATAAA TAACTCTGGT 
GGCACAATAT TAAATAATGG TGAGTATGAT TTATTACCTT CTCAAGGTAT TAAAATAACA 
TCTCGTGGGT TAAATAATGA AGGTGGAAAA ATAGAGTATA AAAATGGTAG CGTTGAAATA 
GCAACAGTTA ACACCATCAA AAATGGTAAA GGTACAATTA AAGCAACATC AACGCAAGGG 
CGGGTAAAAA TGAACCTTCA CAGTAATCAT CTTAATAATA CTGGAGGGAG TGTCATTTCT 
TCAGGAAAAG TAGAGGGTAA AGTTAATAAT ATACGAAACA ATAGAGGGTC CATTATAGGT 
TTAGGGGGAG TGGATTTGAA TGAAACTGTT TTAATTAATA GTACCGGTAA AATAATTTCT 
GGTTTTAATT GA

Protein sequence

MKLTYIKTKQ GLSILPLSII LSLYGSSVAY ADNIIADVQA PIGQQAEVSI IKTPPSVCRA 
LTSYCVGMTE TVVNIQAPDE NGLSHNKYSK FDVVANGLFD VTTLNNRLAQ EVDGNSFLQD 
KLATIILNEV NSSQASLLDG NLHVGGQDAH VIIANPAGIN CRGCSFTNTS HVTLTTGAPS 
FSNNKLNNFI VEQGNINIEK DPSYYMKSGL RNKSMDTTYL DLFAEKITVN GDINADDVYI 
VTGKNKVGFS LPGQPLHVSR LDNENTPVPD TVSLDVSEIG GMYANKIRIY TTDSTIKNKG 
AIRANDTLSL SSAANIDNSN GNISGKMVLL SSEGVINNSG GTILNNGEYD LLPSQGIKIT 
SRGLNNEGGK IEYKNGSVEI ATVNTIKNGK GTIKATSTQG RVKMNLHSNH LNNTGGSVIS 
SGKVEGKVNN IRNNRGSIIG LGGVDLNETV LINSTGKIIS GFN