Gene EcSMS35_3469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3469
Symbol	yhbX
ID	6145555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3546744
End bp	3548261
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	44%
IMG OID	641618298
Product	inner membrane protein yhbX
Protein accession	YP_001745446
Protein GI	170680504
COG category	[R] General function prediction only
COG ID	[COG2194] Predicted membrane-associated, metal-dependent hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0525732
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTCAGC GATTGCTGTT CTTCGTCCTG ACCATCCTGG TTGTTAAACG TATATCATCC 
CTTCCGCTTC GCCTGCTTGT TGCCGCACCA TTTGTGTTAC TGACTGCGGC AGACATGAGT 
ATTAGCCTCT ATTCATGGTG TACCTTTGGT ACAACTTTCA ATGATGGATT TGCGATTAGT 
GTGCTGCAGA GTGATCCGGA TGAAGTTGTG AAAATGTTGG GGATGTATAT CCCTTATCTA 
TGTGCTTTTG CTTTTTTATC CCTTCTTTTT TTGGCAGTAA TAATAAAATA TGATGTTTCC 
TTGCCGACAA AAAAAGTGAC AGGAATATTA TTGCTGATTG TCATTTCGGG CAGTTTATTT 
TCAGCTTGTC AATTTGCTTA TAAAGATGCA AAAAATAAAA AAGCGTTCAG TCCATATATA 
CTAGCGTCTC GATTTGCTAC CTATACACCG TTTTTCAATC TCAATTATTT TGCTTTAGCA 
GCGAAAGAGC ATCAAAGATT ACTCTCAATT GCAAACACGG TGCCGTATTT TCAATTATCA 
GTCAGGGATA CAGGTATTGA TACCTACGTG TTGATTGTGG GGGAGTCTGT ACGTGTCGAC 
AATATGTCTT TGTATGGATA CACACGCTCT ACGACACCGC AAGTCGAAGC ACAAAGAAAA 
CAGATCAAAC TGTTTAATCA AGCAATAAGC GGTGCACCTT ACACTGCGCT GTCGGTTCCC 
CTTTCTTTAA CTGCTGATTC TGTTTTGAGT CATGACATTC ATAATTACCC GGACAACATT 
ATTAATATGG CTAATCAAGC AGGATTTCAG ACTTTCTGGC TAAGCTCGCA ATCCGCTTTT 
CGGCAGAATG GTACAGCAGT TACCAGTATC GCCATGCGCG CCATGGAAAC AGTCTATGTC 
AGAGGATTTG ATGAATTGTT GTTGCCGCAT TTATCGCAAG CGTTACAGCA AAAGACGCAG 
CAAAAGAAAC TGATTGTTCT TCATTTAAAT GGAAGCCATG AACCGGCTTG TAGCGCCTAT 
CCGCAATCCA GCGCCGTGTT TCAACCGCAG GACGATCAGG ATGCCTGCTA TGACAACTCC 
ATTCATTACA CAGATAGTTT GCTAGGTCAG GTTTTTGAAT TATTAAAAGA TCGCCGCGCC 
TCGGTCATGT ATTTTGCCGA CCACGGCCTG GAACGCGACC CTACGAAGAA GAACGTCTAT 
TTTCATGGAG GCAGGGAGGC CAGCCAGCAG GCATATCATG TCCCGATGTT TATCTGGTAT 
AGCCCCGTTC TTGGGGATGG CGTGGATCGC ACAACGGAAA ACGATATCTT TTCCACTGCG 
TACAATAATT ACCTTATTAA TGCGTGGATG GGGGTAACAA AGCCGGAACA GCCGCAAACG 
CTGGAGGAAG TGATTGCACA CTATAAAGGA GACTCACGGG TTGTAGATGC AAACCATGAT 
GTTTTCGATT TTGTGATGCT AAGAAAGGAG TTTACTGAGG ATAAGCAAGG TAACCCCACC 
CCTGAAGGGC AGGGTTGA

Protein sequence

MVQRLLFFVL TILVVKRISS LPLRLLVAAP FVLLTAADMS ISLYSWCTFG TTFNDGFAIS 
VLQSDPDEVV KMLGMYIPYL CAFAFLSLLF LAVIIKYDVS LPTKKVTGIL LLIVISGSLF 
SACQFAYKDA KNKKAFSPYI LASRFATYTP FFNLNYFALA AKEHQRLLSI ANTVPYFQLS 
VRDTGIDTYV LIVGESVRVD NMSLYGYTRS TTPQVEAQRK QIKLFNQAIS GAPYTALSVP 
LSLTADSVLS HDIHNYPDNI INMANQAGFQ TFWLSSQSAF RQNGTAVTSI AMRAMETVYV 
RGFDELLLPH LSQALQQKTQ QKKLIVLHLN GSHEPACSAY PQSSAVFQPQ DDQDACYDNS 
IHYTDSLLGQ VFELLKDRRA SVMYFADHGL ERDPTKKNVY FHGGREASQQ AYHVPMFIWY 
SPVLGDGVDR TTENDIFSTA YNNYLINAWM GVTKPEQPQT LEEVIAHYKG DSRVVDANHD 
VFDFVMLRKE FTEDKQGNPT PEGQG