Gene Shew_3757 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shew_3757
Symbol
ID	4920749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella loihica PV-4
Kingdom	Bacteria
Replicon accession	NC_009092
Strand	-
Start bp	4473477
End bp	4475147
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	61%
IMG OID	640165383
Product	urocanate hydratase
Protein accession	YP_001095882
Protein GI	127514685
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2987] Urocanate hydratase
TIGRFAM ID	[TIGR01228] urocanate hydratase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0181663
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAAGA GACACGACCC TAGCCGTCGC ATCATAGCGC CACATGGCAC TACGCTGAGC 
TGTAAGAGCT GGCTCACCGA GGCGCCGATG CGCATGCTGA TGAACAACCT GCACCCAGAT 
GTCGCCGAGC GTCCGGAAGA CCTGGTGGTC TACGGCGGTA TCGGCCGTGC GGCCCGTGAC 
TGGCAATGCT ATGACAAGAT CGTAGAGGTG CTGCAGCGCC TAGAAGAAGA TGAGACCCTG 
CTGGTACAGT CGGGCAAGCC TGTGGGCGTG TTCAAGACCC ACAGCAACGC GCCGCGCGTC 
ATCATCGCCA ACTCTAACCT GGTGCCACAC TGGGCCAACT GGGAACACTT CAACGAGCTG 
GATAAGAAGG GCCTGGCCAT GTATGGCCAG ATGACTGCAG GTTCTTGGAT CTACATCGGC 
TCTCAGGGCA TTGTCCAGGG CACCTACGAG ACCTTCGTGG CCATGGCCAA GCAACACTTT 
GGTGGCGATG CCAGCGGCAA GTGGATCCTC ACCGGCGGCC TGGGTGGCAT GGGTGGCGCT 
CAGCCACTGG CCGGCACCAT GGCGGGCTAC TCTGTACTGG CCTGTGAGGT GGACGAGACT 
CGCATCGACT TCCGTCTACG TACCCGTTAT GTGGACAAGA AGGCCACTAG CCTGGATGAG 
GCGCTGGCGA TGATCGACGA AGCCAACAAG AGCGGCAAGC CAGTGTCTGT CGGCCTGCTG 
GCCAACGCCG CCGACATCTT CGCCGAGCTG GTAGAGCGTG GCATCACCCC GGATGTAGTG 
ACCGACCAGA CCTCGGCCCA CGATCCACTA AACGGCTATC TGCCACAGGG TTGGACCCTG 
GAATACGCCG CCGAGATGCG TAAGCAAGAT GAGGCGGCCG TGGTTAAGGC GGCCAAGCAG 
TCGATGGCGG TACAGGTTAA AGCCATGCTG GCCCTGCAGG CGGCAGGTGC GGCCACCACA 
GACTATGGTA ACAACATTCG CCAGATGGCG TTCGAAGAGG GCGTGGAAAA TGCCTTCGAC 
TTCCCAGGCT TCGTGCCCGC CTATGTGCGC CCACTCTTCT GCGAAGGCAT AGGTCCCTTC 
CGCTGGGCGG CGCTCTCTGG CGATCCGGAA GATATCTACA AGACAGATGC CAAGGTGAAG 
GAGCTGATCC CAGACAACCC ACACCTGCAT AACTGGCTGG ACATGGCGCG TGAGCGCATC 
GCTTTCCAGG GCCTGCCGGC ACGTATCTGC TGGGTCGGCC TGAAAGACAG GGCGCGTCTG 
GCTAAGGCCT TCAACGAGAT GGTGAAAAAC GGTGAGCTGT CGGCGCCAAT CGTGATCGGT 
CGTGACCATC TGGATTCTGG CTCTGTGGCA AGCCCTAACC GCGAGACCGA ATCTATGCTT 
GACGGCAGCG ATGCGGTATC GGATTGGCCG CTGATGAACG CCCTACTTAA CACGGCAAGC 
GGCGCGACCT GGGTGTCTCT GCACCATGGC GGCGGCGTCG GCATGGGCTT CAGCCAACAC 
TCGGGTGTGG TGATCGTTGC CGATGGTACC GACGAGGCCG AGGCGCGTCT GGGCCGTGTG 
CTGTGGAACG ACCCTGCCAC TGGCGTGATG CGTCATGCGG ATGCTGGCTA TGAGATCGCC 
AAGCAGTGCG CCAAGGAGCA GGGCCTGGAT TTGCCTATGC TCGACCTATA A

Protein sequence

MDKRHDPSRR IIAPHGTTLS CKSWLTEAPM RMLMNNLHPD VAERPEDLVV YGGIGRAARD 
WQCYDKIVEV LQRLEEDETL LVQSGKPVGV FKTHSNAPRV IIANSNLVPH WANWEHFNEL 
DKKGLAMYGQ MTAGSWIYIG SQGIVQGTYE TFVAMAKQHF GGDASGKWIL TGGLGGMGGA 
QPLAGTMAGY SVLACEVDET RIDFRLRTRY VDKKATSLDE ALAMIDEANK SGKPVSVGLL 
ANAADIFAEL VERGITPDVV TDQTSAHDPL NGYLPQGWTL EYAAEMRKQD EAAVVKAAKQ 
SMAVQVKAML ALQAAGAATT DYGNNIRQMA FEEGVENAFD FPGFVPAYVR PLFCEGIGPF 
RWAALSGDPE DIYKTDAKVK ELIPDNPHLH NWLDMARERI AFQGLPARIC WVGLKDRARL 
AKAFNEMVKN GELSAPIVIG RDHLDSGSVA SPNRETESML DGSDAVSDWP LMNALLNTAS 
GATWVSLHHG GGVGMGFSQH SGVVIVADGT DEAEARLGRV LWNDPATGVM RHADAGYEIA 
KQCAKEQGLD LPMLDL