Gene Cpin_2007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpin_2007
Symbol
ID	8358158
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chitinophaga pinensis DSM 2588
Kingdom	Bacteria
Replicon accession	NC_013132
Strand	+
Start bp	2446417
End bp	2448081
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	51%
IMG OID	644964194
Product	urocanate hydratase
Protein accession	YP_003121703
Protein GI	256421050
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2987] Urocanate hydratase
TIGRFAM ID	[TIGR01228] urocanate hydratase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0339801
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.22403
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGTT CGGACTTTAT TAAGACATAT GCGGCACACC CGCATTATAA AGCGCCCCAT 
GGCAATCAGC TGCACGCGCG CTCCTGGCAG ACAGAAGCAC CCTTACGTAT GCTCCTGAAT 
AACCTGGATG CCGAAGTGGC TGAGAATCCT GATGAACTGG TGGTGTATGG TGGTATCGGT 
CAGGCTGCAC GTAACAAAGA ATCCTTACAG AAGATCATTG AGATCCTGCT GGAACTGGAC 
GAAGATCATT CTTTGCTGGT ACAGTCGGGT AAACCCGTTG GCGTTGTTCG TACCCATCCG 
CAGGCGCCCC GCGTTATGCT GGCGAATAGT AACCTGGTGC CTAAATGGGC TACCTGGGAA 
CATTTCAACG AACTGCGTGC AAAAGGACTC ATGATGTACG GACAGATGAC AGCAGGTAGC 
TGGATCTATA TCGGTACACA GGGTATCTTA CAGGGTACCT ACGAGACTTT TGTGGCTTGT 
GGCCGTCAGC ATTTCAATGG CGACCTGAAA GGTAAACTGC TCGTGACGGC AGGTATTGGT 
GGTATGGGTG GCGCACAGCC ATTGGCTGCT ACCATGGCCG GTGCTGTATT CCTGGGTGCA 
GATGTGGATG AATCACGTAT CCGCAAGCGC CTGGCTACCC GTTATATCGA CCGTATTACC 
CACTCTTATG AGGAGGCGAT TGCCTGGGCA ATGGACGCTA AAGCCAAAGG GGAAGCACTG 
TCCATCGGGC TGGTAAGTGA TGCGGGAGAT ATGCTGGAAC GCTTACTGAA AGACAATATT 
ATTCCTGATA TACTGACTGA CCAGACCTCC GCGCACGATC CTATTAACGG ATATGTGCCG 
AATGGGCTTT CCCTGGAAGA AGCGACGGCA TTACGTAAAA AAGACCCGGC AGACTACAAA 
GCCCGCTCTT TAAAGAGTAT GGCCCGTCAC GTATCTTTTA TGCTGGCTTT ACAGGGAAAG 
GGCGCTGTTA CCTTTGACTA TGGTAATAAC CTGCGTGAGT TTGCACGTGA AGGTGGAGAA 
CCTAACGCCT TCAACTTCCC GGGATTTACG CCTGCCTATA TCCGTCCCCT TTTCTGTGAA 
GGGAAAGGAC CTTTCAGATG GGTGGCTTTA TCCGGCGATC CTGAAGATAT TTATACCACC 
GACAAGGCAT TGATGGAAGC CTTTCCGGAG AATACGGCCC TGATCAACTG GCTGAAGAAA 
GCACAGGCAC AGGTAGCCTT CCAGGGATTA CCTGCGCGTA TCTGCTGGCT GGGATTAGGC 
GAAAGAGAAA AAGCCGGTCT TATTTTCAAT GAACTGGTGA GAACAGGTAA AGTGAAAGCG 
CCTATTGTGA TCGGTCGCGA TCACCTGGAT TGTGGTTCTG TCGCATCTCC CAACAGGGAA 
ACAGAAGCGA TGAAAGATGG TTCGGATGCG GTGTCTGACT GGACTTTATT AAACCTGATG 
GCGAATACCG GCGGTGGTGC TACCTGGGTA TCTTTCCATC ATGGTGGCGG CGTTGGTATG 
GGTTATTCAC AACATGCAGG CATGGTCGTA CTGGCAGATG GATCTGAACG TGCGGAAGCC 
TGTCTGAAAA GAGTATTATT CAATGATCCG GCATTGGGCA TCTTCCGACA TGCGGATGCA 
GGGTATGAAG AAGCAAAAGC AACTGCCAGA AAATTCAATA TCTGA

Protein sequence

MNSSDFIKTY AAHPHYKAPH GNQLHARSWQ TEAPLRMLLN NLDAEVAENP DELVVYGGIG 
QAARNKESLQ KIIEILLELD EDHSLLVQSG KPVGVVRTHP QAPRVMLANS NLVPKWATWE 
HFNELRAKGL MMYGQMTAGS WIYIGTQGIL QGTYETFVAC GRQHFNGDLK GKLLVTAGIG 
GMGGAQPLAA TMAGAVFLGA DVDESRIRKR LATRYIDRIT HSYEEAIAWA MDAKAKGEAL 
SIGLVSDAGD MLERLLKDNI IPDILTDQTS AHDPINGYVP NGLSLEEATA LRKKDPADYK 
ARSLKSMARH VSFMLALQGK GAVTFDYGNN LREFAREGGE PNAFNFPGFT PAYIRPLFCE 
GKGPFRWVAL SGDPEDIYTT DKALMEAFPE NTALINWLKK AQAQVAFQGL PARICWLGLG 
EREKAGLIFN ELVRTGKVKA PIVIGRDHLD CGSVASPNRE TEAMKDGSDA VSDWTLLNLM 
ANTGGGATWV SFHHGGGVGM GYSQHAGMVV LADGSERAEA CLKRVLFNDP ALGIFRHADA 
GYEEAKATAR KFNI