Gene YpsIP31758_0653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_0653
Symbol
ID	5386355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	760761
End bp	761954
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	50%
IMG OID	640863624
Product	flagellin
Protein accession	YP_001399645
Protein GI	153950229
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACTGT CTATCCACAC GAATGCTTCT GCTAAAACAG CTATCAACAG CCTGAGTAAT 
GCGGGTCTGG CGAATGCCAA ATCTTCACAG CGCCTGTCTA CCGGTTTTCG CATTAACTCA 
CCCGCGGACA ACGCGGCGGG CTTGCAGATC ACTAACCGTA TGGAGAAGTT TTTAAACGGT 
GCGGGCCAGG CTAAGCAGAA CATTCAAGAA TCCATCGCTA TGCTGCAAAT TGCCGATGGT 
GGCTTGGCTG AATCGGTCAA AACCCTGAAC GCCATGAAGA AGCTGGCAAC CCAGGCGGCG 
AACGACACCA ACTCTGCGGC AGACCGCGAG GCTATCCAAA AAGAATTTAC CGAGCTGGGT 
AAAGAGCTGC AAAACGCGCT GAACAACACC GAATATAACT CCGAGAAGCT GTTTGCTGAT 
GGCGGCAAAA TGCGTAAGGA ATTGAACTTC CAGAGCGGTA CTGATGCAGG ATCCAGCCTG 
AAATTAAATC TGAATGACGT GATTGCAGAG CTGACTGAGA GTGTGACCAA ACCGGGGACG 
GCAATTACTG CTGATGCGAG TGGCACGCCA GCGCAAAAAG AACTCGCTAG ATTGAATCAG 
GTAACAGCAG ATGCTTTAAG AGAGAAAGAA CTTGCTAAAA AAGCGAAAAC AGATTTGGGC 
GCTGTTCAAG CGGGTGCTAA TGCGACAGCA AATATTGATA TTCCTGAATA TAAGGATGCC 
AATGGTCAGA CTGTTTTGGG CAAGAGAATT GCTAGTGGTG CCACTGTCAG TGCAGGCGAT 
ATCGCCCAGA TTGATGCCGC TGTCACTGCC CTGACTCAGG TACATACAGA TGCAGATAAA 
GCTTCAACCG ACTACGCAAA CAACAATCTG GTAGGTGGCG GTGTCATGAA CATGCGACTG 
GCGGATAAAG ATCTGGCCAT GGAGGCGGAT AAAAAACTGT CTGAAGTGAT TGATGCCTAT 
GGCGCTTTCC GTGCCACGTT GGGGGCGAAC CAGAACCGCC TGCAATCCTC TTCCAATAAC 
CTGGATAATA TGATCAGCAA CACCGCACAG GCGCTGGGCA GCATCAAAGA TACCGATTTT 
GCGGATGAGA TGAAAAACCA CGCGCAGAGC GAAATGTTAA TGCAATCGAG CGTGATGATG 
CTGAAAAAAG CCAACGCCGC AACGCAGTTG ATTTCGACCC TGCTGCAAGG CTAA

Protein sequence

MALSIHTNAS AKTAINSLSN AGLANAKSSQ RLSTGFRINS PADNAAGLQI TNRMEKFLNG 
AGQAKQNIQE SIAMLQIADG GLAESVKTLN AMKKLATQAA NDTNSAADRE AIQKEFTELG 
KELQNALNNT EYNSEKLFAD GGKMRKELNF QSGTDAGSSL KLNLNDVIAE LTESVTKPGT 
AITADASGTP AQKELARLNQ VTADALREKE LAKKAKTDLG AVQAGANATA NIDIPEYKDA 
NGQTVLGKRI ASGATVSAGD IAQIDAAVTA LTQVHTDADK ASTDYANNNL VGGGVMNMRL 
ADKDLAMEAD KKLSEVIDAY GAFRATLGAN QNRLQSSSNN LDNMISNTAQ ALGSIKDTDF 
ADEMKNHAQS EMLMQSSVMM LKKANAATQL ISTLLQG