Gene Cpin_5150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpin_5150
Symbol
ID	8361327
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chitinophaga pinensis DSM 2588
Kingdom	Bacteria
Replicon accession	NC_013132
Strand	+
Start bp	6429054
End bp	6430754
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	48%
IMG OID	644967299
Product	glycoside hydrolase family 39
Protein accession	YP_003124783
Protein GI	256424130
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3664] Beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0964315
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.00110099
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAAAGA TCTTACTGTT CAGCCTTTGT ATAGCCCTGG GTGATACTTT ATCCGCCCAA 
TCCACCCCTA CTACTTTAAC AGATAATATA CCTGCGTCCA TTGAGGTACG TCTGGGGCAG 
ATAACTGGTC CGATGAAACC TGTATGGGCC TGGTTTGGTT ACGATGAACC GAATTATACC 
TATATGAAGG ACGGGAAAAA GTTACTCAGT GAAATTGCGG CACTCAGTCC GGTACCGGTA 
TATGTCAGGA CGCATAGTCT GCTGGTAAGC GGAGACGGTG TTGCCGCCCT CAAGTGGGGT 
TCTACCAATG TATATACCGA AGATGCAAAC GGCCAGCCAG TTTACAACTG GACAATCATC 
GACAGCATCT TCGACACCTA TATCAACCGC GGCATGAAAC CGCTGGCACA GATCGGCTTT 
ATGCCGCAGG CACTCTCCAC CCATCCTGAG CCCTACCGGC ACTACTGGAA ACCCGGTGAT 
CCATATACAG ATATTATTAC CGGCTGGGCA TATCCGCCTA AAGACTATGA CAAATGGCGG 
GAGCTTGCCT ATCAGTGGGC TAAGCACTCC GTAGAGCGTT ACGGCCAAAA GGAAGTGGAA 
AGCTGGTATT GGGAAGTCTG GAATGAGCCA AACGGTCACT ATTGGAAAGG TACGCGGGAA 
GAGTTCTTCA AACTATACGA CTATGCCGCT GATGGCATTA AAAAGGCCCT GTCCACTGCC 
AGGATCGGCG GTATCAATAT AGCTGGTACA AGTAGTAAAA CGGCTACTGA ATGGACCACA 
CAATTTATTG AGCACTGTAT TTCCGGGACC AATTACGCTA CCGGTAAAAC CGGCGCTCCG 
CTGGATGCCT TGTTATTTCA TGCCAAAGGA AATCCTAAAC TGGTCAATGG TATCGTTAGG 
ATGAATATGT CGCCTCAACT GCGTGATATA GCAGCAGGTT TCCGTATTGC CGCATCCTAT 
CCCCAGACGC GTAATCTGCC ATTGATCATC GGGGAATCAG ATCCTGAAGG TTGTGCTGCC 
TGTGGTATGG CTACCAATCC TGAAAATGCC TATCGCAACG GTACACTATA TTCCAGCTAT 
ACAGCGGCCT CCTTTGCCCG TAAATACCTG CTGGCCGATC AATACGCGAT CAATTTCCTG 
GGCGCCGTAT CCTGGTCATT TGAATTTGAA AACCAACCCT GGTTTTACGG ATTCAGGGAC 
CTGGCTACCA ATGGTGTAGA TAAACCGGTG CTCAATGTAT TCCGGATGTT TGGTATGATG 
CGCGGCGACA GGGTCAACGT TTCCTCCAGC CGCATGTATC CATTGGAAAC GGTCCTGGAT 
TCCAGTATCA GGGGGCAGCA GACCGAAATC GGCGCATTGG CTTCCAAAGC AGCTCACACA 
GCAGCGGCAA TGGTATGGAA TTATCATGAT GAAGATAAAA AAGGCCCTGC TGAGCTGGTG 
AATCTGACTT TTAAAGACGT ACCGGCCCAA AAGGTAATCA TAAAAACCTA TCTTATAGAT 
AGTGATCACA GCAATTCCTA CGAAGTATGG AAAAAGATGG GATCTCCACA GCATCCGACT 
AAAAAGCAGA TCAGTACACT GGAAAAAGCA GGAAAGCTAC AGATTGTACA GACAATACAA 
AAAGCAAGCA TGAACGGAGA GGTGCAGCTG CCCCTTCGTT TGCAGCGTCA GGCAGTTGCA 
CTAGTGACAC TCAGCTGGTA A

Protein sequence

MKKILLFSLC IALGDTLSAQ STPTTLTDNI PASIEVRLGQ ITGPMKPVWA WFGYDEPNYT 
YMKDGKKLLS EIAALSPVPV YVRTHSLLVS GDGVAALKWG STNVYTEDAN GQPVYNWTII 
DSIFDTYINR GMKPLAQIGF MPQALSTHPE PYRHYWKPGD PYTDIITGWA YPPKDYDKWR 
ELAYQWAKHS VERYGQKEVE SWYWEVWNEP NGHYWKGTRE EFFKLYDYAA DGIKKALSTA 
RIGGINIAGT SSKTATEWTT QFIEHCISGT NYATGKTGAP LDALLFHAKG NPKLVNGIVR 
MNMSPQLRDI AAGFRIAASY PQTRNLPLII GESDPEGCAA CGMATNPENA YRNGTLYSSY 
TAASFARKYL LADQYAINFL GAVSWSFEFE NQPWFYGFRD LATNGVDKPV LNVFRMFGMM 
RGDRVNVSSS RMYPLETVLD SSIRGQQTEI GALASKAAHT AAAMVWNYHD EDKKGPAELV 
NLTFKDVPAQ KVIIKTYLID SDHSNSYEVW KKMGSPQHPT KKQISTLEKA GKLQIVQTIQ 
KASMNGEVQL PLRLQRQAVA LVTLSW