Gene Cwoe_3641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_3641
Symbol
ID	8734096
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	-
Start bp	3876549
End bp	3878204
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	74%
IMG OID	646504263
Product	urocanate hydratase
Protein accession	YP_003395433
Protein GI	284045093
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2987] Urocanate hydratase
TIGRFAM ID	[TIGR01228] urocanate hydratase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.278935
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTCG CGGCGAGCGG CGGCGCGCTC CGCTGCCGCG GCTGGCAGCA GGAGGCCGCG 
CTGCGGATGC TGGAGAACAA CCTCCACCCG GACGTCGCCG AGAAGCCGTC CGAGCTGATC 
GTCTATGGCG GCATCGGCAA GGCCGCGCGC GACCGGGCGA GCTACGACGC GATCGTGCGC 
GAGCTGACCC GGCTCGGCGA CGAGCAGACG CTGCTGGTCC AGTCCGGCAA GCCGGTCGCG 
GTCTTCGACA CGCACCCGCA CGCACCGCGC GTGCTGCTGG CCAACTCGAA CCTCGTCCCC 
GACTGGGCGA ACTGGGAGAC GTTCCGCGAG CTCGACGCCG CCGGGCTGAC GATGTACGGC 
CAGATGACGG CCGGGTCGTG GATCTACATC GGCTCGCAGG GGATCCTCCA GGGCACCTAC 
GAGACGTTCG CGGCGATCGC GCGCAAGCGC TTCGGCGGGT CGCTCGCCGG CCGCCTCGTC 
GTGACCGCCG GGCTCGGCGG GATGGGCGGC GCGCAGCCGC TCGCGGTCAC GCTCAACGAC 
GGCTGCGCGC TGTGCGTCGA AGTCGACCTG CAGCGGATCG AGCGCCGCAT CCGGACGGGC 
TACCTCGACG AGCGCGCCGC GGACCTCGAC GACGCGCTCG CGCGGCTGGA GACGGCGCAG 
GCCGAGCGCC GCCCGCTGTC GATCGGCCTG CTCGGCAACG TCGCCGACGT GCTGCCGGAG 
CTGGTCCGCC GCGGCGTCGC GATCGACGTC GTGACCGATC AGACGAGCGC TCACGATCCG 
CTCACCGGCT ACATCCCCGC CGGCCTGACC GTCGAGCAGG CCGACACGCT GCGCACGCGC 
GACCAGGACG ACTACCTGCG CCGCGTCGGC GAGAGCGCGG TGACGCACGT CGGCGCGATC 
CGCGCGCTCC AGCAGGCGGG CGCCGAGGCG TTCGACTACG GCAACGCGCT GCGTGGCCTC 
GCCGCCGCGC ACGGCGACGC CGACGCGTTC TCCTACCCGG GCTTCGTGCC GGCGTACATC 
CGCCCGCTCT TCTGCGAGGG CAAGGGCCCG TTCCGCTGGG TCGCGCTGTC GGGCGACCCG 
GAGGACATCC GCAGGACGGA CGCGGCGATC CTCGACCTCT TCGGCGACCA GGAGCACGTC 
GCGCGCTGGA TCCGGCTCGC GGGCGAGAAG GTGCGGTTCC AGGGGCTGCC GGCGCGGATC 
TGCTGGCTCG GCTACGGCGA GCGCGACCGT GCCGGGCTGC GCTTCAACGA GATGGTCGCG 
AGCGGCGAGC TGCGCGCGCC GATCGTGATC GGCCGCGACC ACCTCGACGG CGGCTCGGTC 
GCCTCGCCCG AGCGCGAGAC GGAGGCGATG CGCGACGGCT CCGACGCGAT CGCCGACTGG 
CCGCTGCTGA ACGCGCTGAT CAACACGGCG TGCGGCGCCA CGTGGGTCTC GATCCACCAC 
GGCGGCGGTG TCGGGATGGG CAAGTCGATC CATGCCGGCC AGGTGGTCGT CGCCGACGGC 
ACCGCCGGCG CGGCCGAGCG GATCCGGCGC ACGCTGACGG CCGACCCGGG GATGGGGATC 
GTCCGCCACG TCGACGCCGG CTATCCCGAG GCGATCGACG CCGCGCGGCG GCTCGGCGTG 
CACGTGCCGA TGCTCGACGG CCCTCCGGCG GCCTGA

Protein sequence

MNVAASGGAL RCRGWQQEAA LRMLENNLHP DVAEKPSELI VYGGIGKAAR DRASYDAIVR 
ELTRLGDEQT LLVQSGKPVA VFDTHPHAPR VLLANSNLVP DWANWETFRE LDAAGLTMYG 
QMTAGSWIYI GSQGILQGTY ETFAAIARKR FGGSLAGRLV VTAGLGGMGG AQPLAVTLND 
GCALCVEVDL QRIERRIRTG YLDERAADLD DALARLETAQ AERRPLSIGL LGNVADVLPE 
LVRRGVAIDV VTDQTSAHDP LTGYIPAGLT VEQADTLRTR DQDDYLRRVG ESAVTHVGAI 
RALQQAGAEA FDYGNALRGL AAAHGDADAF SYPGFVPAYI RPLFCEGKGP FRWVALSGDP 
EDIRRTDAAI LDLFGDQEHV ARWIRLAGEK VRFQGLPARI CWLGYGERDR AGLRFNEMVA 
SGELRAPIVI GRDHLDGGSV ASPERETEAM RDGSDAIADW PLLNALINTA CGATWVSIHH 
GGGVGMGKSI HAGQVVVADG TAGAAERIRR TLTADPGMGI VRHVDAGYPE AIDAARRLGV 
HVPMLDGPPA A