Gene Sbal223_0102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_0102
Symbol
ID	7087367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	117632
End bp	119299
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	54%
IMG OID	643459026
Product	urocanate hydratase
Protein accession	YP_002356066
Protein GI	217971315
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2987] Urocanate hydratase
TIGRFAM ID	[TIGR01228] urocanate hydratase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACAAGC GACACGACCC AAGCCGCCGC ATTATTGCAC CGCATGGAAC AAGATTAAGC 
TGCAAAAGCT GGTTGACCGA AGCGCCAATG CGCATGTTAA TGAACAACTT ACATCCCGAT 
GTCGCCGAGC GCCCAGAAGA CTTAGTCGTC TATGGTGGTA TCGGCCGCGC CGCTCGCGAC 
TGGGATTGCT ATGACAAAAT CATCGAAGTC TTACAACGCC TCGAAGATGA CGAAACCTTA 
TTAGTGCAAT CGGGCAAACC TGTGGGCGTA TTTCGCACCC ATGCCGATGC ACCGCGCGTG 
CTGATTGCTA ACTCAAACCT AGTGCCACAT TGGGCGAACT GGGAGCATTT CAACGAGTTA 
GATAAGCTAG GTTTGGCCAT GTACGGCCAG ATGACCGCAG GTTCTTGGAT CTACATTGGT 
ACACAAGGCA TAGTTCAAGG TACCTACGAG ACCTTTGTGT CTGTAGCGAA ACAGCACTTT 
GAGGGTATCT CCAAAGGTAA ATGGATCCTC ACCGGCGGGT TAGGCGGCAT GGGCGGCGCG 
CAAACGCTGG CGGGCACTAT GGCTGGCTTC TCGGTGTTAG CCTGTGAAGT CGACGAGACT 
CGCATCGATT TCCGTTTGCG CACCCGCTAT GTTGACAAAA AAGCCACTTC GCTCGATGAA 
GCATTGGCGA TGATTGAAGA GGCAAACCAA GCTGGTAAGC CTGTATCTGT TGGCTTACTA 
GCAAATGCCG CCGATGTGTT TGCCGAACTG GTTAAGCGCG GCGTTACACC TGATGTCGTA 
ACTGACCAAA CCTCGGCCCA CGATCCATTA AACGGTTATT TGCCGCAGGG TTGGACTATG 
GCAGAGGCCG CAGCCATGCG TAAAACCGAC GAAGCGGGCG TAGTGAAAGC AGCAAAAGCC 
TCGATGGCGG TGCAAGTACA AGCCATGCTC GACCTGCAAA CCGCGGGTGC AGCAACGCTC 
GATTACGGAA ACAACATTCG CCAAATGGCG TTTGAAGTGG GCGTTGAAAA CGCCTTTGAT 
TTCCCAGGCT TTGTGCCTGC ATACATTCGC CCGCTGTTCT GTGAGGGCAT TGGCCCGTTC 
CGCTGGGTAG CACTGTCTGG CGATCCAGAA GATATCTATA AAACCGACGC CAAAGTGAAA 
GAACTTATTC CGGATAATCC ACATCTGCAC AATTGGTTAG ACATGGCGCG TGAGCGTATC 
GCCTTCCAAG GTCTGCCTGC GCGTATCTGC TGGGTCGGCT TAAAAGATCG CGCTCGTTTA 
GCGTTAGCCT TTAACGAAAT GGTCAAAAAT GGTGAGTTGT CGGCGCCTGT GGTGATTGGC 
CGCGATCACT TAGATTCTGG CTCTGTTGCC AGCCCGAACC GCGAAACCGA ATCTATGCTG 
GACGGCTCAG ATGCGGTATC CGATTGGCCA TTATTGAATG CACTACTCAA CACCGCCAGC 
GGCGCGACTT GGGTATCTTT GCACCACGGC GGCGGCGTCG GCATGGGCTT TAGCCAACAT 
TCGGGTGTGG TGATTGTGTG TGACGGTACC GATGCGGCGG CAAAACGGGT TGGCCGTGTG 
CTGTGGAATG ACCCAGCGAC AGGCGTGATG CGCCATGCCG ATGCGGGCTA CGAGATTGCG 
AAAAACTGCG CCAAAGAGCA GGGGCTCGAC TTACCTATGC AAGAGTAG

Protein sequence

MDKRHDPSRR IIAPHGTRLS CKSWLTEAPM RMLMNNLHPD VAERPEDLVV YGGIGRAARD 
WDCYDKIIEV LQRLEDDETL LVQSGKPVGV FRTHADAPRV LIANSNLVPH WANWEHFNEL 
DKLGLAMYGQ MTAGSWIYIG TQGIVQGTYE TFVSVAKQHF EGISKGKWIL TGGLGGMGGA 
QTLAGTMAGF SVLACEVDET RIDFRLRTRY VDKKATSLDE ALAMIEEANQ AGKPVSVGLL 
ANAADVFAEL VKRGVTPDVV TDQTSAHDPL NGYLPQGWTM AEAAAMRKTD EAGVVKAAKA 
SMAVQVQAML DLQTAGAATL DYGNNIRQMA FEVGVENAFD FPGFVPAYIR PLFCEGIGPF 
RWVALSGDPE DIYKTDAKVK ELIPDNPHLH NWLDMARERI AFQGLPARIC WVGLKDRARL 
ALAFNEMVKN GELSAPVVIG RDHLDSGSVA SPNRETESML DGSDAVSDWP LLNALLNTAS 
GATWVSLHHG GGVGMGFSQH SGVVIVCDGT DAAAKRVGRV LWNDPATGVM RHADAGYEIA 
KNCAKEQGLD LPMQE