Gene Cpin_4534 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpin_4534
Symbol
ID	8360707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chitinophaga pinensis DSM 2588
Kingdom	Bacteria
Replicon accession	NC_013132
Strand	+
Start bp	5656162
End bp	5657202
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	49%
IMG OID	644966689
Product	aldo/keto reductase
Protein accession	YP_003124177
Protein GI	256423524
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.00676979
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACTATA AGATCTTCGG AAAGAAGTCA GGCCTGCGTG TGTCTGAGCT TGTACTAGGA 
ACTGGTAATT TCGGTACGCG CTGGGGACAT GGCGCTACCC CGGAAGAATC GAAGAAGGTA 
TTCGACGCGT ATGTTGCCGC TGGGGGCAAC TTTATTGATA CAGCTGACGG GTACCAGGTA 
GGAGAATCTG AAGAGCTCCT GTCGGGTTTT ATTGCTGATA AAAGAAATGA CCTGGTACTA 
GCTTCTAAAT TTAGCACCGG CGGTTCTACA TTGCTGACTA CAGGTAATAG CCGCAAGAAC 
ATCGTCCGTT CTGTTGAAGC AAGTCTTAAG CGTCTTAATA CGGATAGACT GGACTTGTAC 
TGGGCGCATA TTGATGACAG GCAGACACCT GTAGAGGAAA TTGTCCGCGG TTTAGATGAT 
CTTGTACAAA GCGGAAAGAT CGTTTATGCA GGCTTTTCAA ACTATCCTGC CTGGAAAACC 
GCCAATGCCT CCCTCATGGC CGATCTGCGC GGCTGGGCGC CGATTGTAGG TATTCAGATA 
GAATACAACC TGATTGAACG TACGCCTGAT AGGGAATTGC TGCCGATGGC AGAAGCATTA 
GGCCTTGGAG TCGCCTTCTG GTCACCGCTC GCCGGAGGTA CACTCACCGG AAAATATCGT 
ACACCTGCAA CAAACAAAGA CTCCCGGCTG GAAAAATGGG GCGACTTTCT TGTTAAAGGC 
GAAAAAACCA ACCGAGAGAC GCTTATACTG GATACGCTTA CCGATATTGC CGGCACGCAT 
CAGGCAAAAT TGCTCCATGT GGCATTGGCA TGGTTACGTC AGATTTATAA ACCTAACGAA 
TTGTCAACAG TAACCATTAT CGGTCCTCGT AACCAGGAGC AATTACAGGA TAACCTCGAC 
TCATTACAGG TAACGCTCAG TGAAGACGAG ATCAAAAGAC TCAGCGACGT GAGTGCCATC 
TCATTGGGAT CACCGCATGA AATTATTACA GCTTCCCAGC AGCTCATCTT TGGCGCGGGG 
TCAGGACATA CACAATCCTG A

Protein sequence

MNYKIFGKKS GLRVSELVLG TGNFGTRWGH GATPEESKKV FDAYVAAGGN FIDTADGYQV 
GESEELLSGF IADKRNDLVL ASKFSTGGST LLTTGNSRKN IVRSVEASLK RLNTDRLDLY 
WAHIDDRQTP VEEIVRGLDD LVQSGKIVYA GFSNYPAWKT ANASLMADLR GWAPIVGIQI 
EYNLIERTPD RELLPMAEAL GLGVAFWSPL AGGTLTGKYR TPATNKDSRL EKWGDFLVKG 
EKTNRETLIL DTLTDIAGTH QAKLLHVALA WLRQIYKPNE LSTVTIIGPR NQEQLQDNLD 
SLQVTLSEDE IKRLSDVSAI SLGSPHEIIT ASQQLIFGAG SGHTQS