Gene YpsIP31758_3036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_3036
Symbol	wzz
ID	5385752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	3417834
End bp	3418985
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	36%
IMG OID	640866042
Product	ferric enterobactin transport protein FepE
Protein accession	YP_001401996
Protein GI	153950685
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3765] Chain length determinant protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.177075
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAATA AACAGGCACG AAATAACCTT GATAACCCAA TGCCGAATAA CTATGATTTT 
TCAAATGTAT CTTCTTCAAG AAATGAAATT GATCTCTTTG AAATTTTTGG TGTTGTATTT 
AAATCAAAGT TCAAGATAAT ATTAATAACA CTATTTTTCT TAATTAGTGG TTTAGTGGTC 
TCATATATCC TCCCCCAAAA ATGGACAAGC ACTGCAATAA TAGCTCTTCC TGGTGATGAG 
CAAGTTCAAG TTCTGGATGA ACTAATCACA AATCTGACCG TGCTTGATAT AAAGGTTGAT 
GTGAGTGCTA ATTATTTGCT GTCAACATTC AAACAAAATT TCGATTCTCA AGATCTCCGT 
GAACAATATT TAGTAAATAC TAATTACTTT AAACGTTTGA TGAAGAATAA TCCAGAAGAT 
GGTTTGGATA AAAGAGCGTT AATAGAGCGA ATCGTAAATG AAAATATTTC TTCGGTTAAC 
CCATTGAAAG ATAAAACCGA GGGTGAAAAT GAATATCGCT ATTATAAATT ATCATATAGT 
GCAAGCACAC CGACAGACGC TCGTGACTTG TTGCAAGGCT CTATTAACTA TGTAAATACC 
ATCGTTAATG CTGATGTTTT CCGAAAAATA CAGCGAGCAG TGGATTTAGC CAAGGGTATC 
GGTACAGATA AATACTCTAT GGAATTGTTG AAAGCTAGAA ATAACCAAAA AGTTAAAATT 
GAGCGCTTAA GGTATGCTTC TTCTATCGCT GATGCCGCAG GTGTAAAAAA ACCAGTTTAC 
AGCAATGGCT CAGCCATTAG TGATGATCCA GACTTCCCTA TTACTATGGG ATCCGATGCG 
CTGAACCGTA AACTGGAAAT AGAGAAGTCA GTTATCGACC TGGCTTCAAT CAATACTGAA 
CTTCTAAACC GTAAGTTGTA TTTGGATAAA TTAAATAGGT TAGAAATTCC TAATGTTAAT 
ATTGTGCCAT TTAAATATTT GCAACAGCCA ACGGAACCCA CTAAAAGAGA TGCCCCTAAG 
CGCGCATTGA TTGTGATTCT GTTTGCCCTG GTCGGTCTTA TGGGTTCTGT CGGTTTTGTT 
TTAGTTGAGC ACTTTGTGCG TGAACGGAAG CGAGAAGAAG AGGGGCTTAA GCTCTCTCAA 
ACTAAGGAAT AG

Protein sequence

MSNKQARNNL DNPMPNNYDF SNVSSSRNEI DLFEIFGVVF KSKFKIILIT LFFLISGLVV 
SYILPQKWTS TAIIALPGDE QVQVLDELIT NLTVLDIKVD VSANYLLSTF KQNFDSQDLR 
EQYLVNTNYF KRLMKNNPED GLDKRALIER IVNENISSVN PLKDKTEGEN EYRYYKLSYS 
ASTPTDARDL LQGSINYVNT IVNADVFRKI QRAVDLAKGI GTDKYSMELL KARNNQKVKI 
ERLRYASSIA DAAGVKKPVY SNGSAISDDP DFPITMGSDA LNRKLEIEKS VIDLASINTE 
LLNRKLYLDK LNRLEIPNVN IVPFKYLQQP TEPTKRDAPK RALIVILFAL VGLMGSVGFV 
LVEHFVRERK REEEGLKLSQ TKE