Gene Cpin_6044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpin_6044
Symbol
ID	8362226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chitinophaga pinensis DSM 2588
Kingdom	Bacteria
Replicon accession	NC_013132
Strand	+
Start bp	7642530
End bp	7644035
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	48%
IMG OID	644968178
Product	glycoside hydrolase family 43
Protein accession	YP_003125657
Protein GI	256425004
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3507] Beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.845022
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.0554344
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCGGA CTAAAAAGTA TCTTGCTCTA CTGCTTTCGT TTGTTTGTCT GTCAATGTGT 
GCCACGCTCC ACGCTCAGTC CACAACAGGC CCTGTTATCG CAGGCGACCT GGCAGATCCA 
TCCATCATAA AAGTCGACAG CGTCTACTAT GCAACAGGTA CCTCCTCAGA ATGGGCGCCT 
TATTATCCTG TCTACAAGTC GTCTAACCTG AAAGACTGGC GACAGACAGG CTACGTGTTT 
GACAAAGCAC CGGATTGGAC AGTAGGCTCC TTCTGGGCGC CGGAATATTA TCAAATAGGC 
GACACCTATT ACATGTATTA TACCGCCAGA CGAAAGTCGG ACAACCAATC CTTTATCGGT 
GTCGCAACAT CCCGCTACCC CGATCATGGA TTTATTGACC ATGGCGTCAT CATCGAACAT 
GGAAAAGAAG CCATCGATGC TTTTATCTAC GATGACAATG GCCAACGATA TATCACATTT 
AAGGCATACG GACTGGAAAA CAGACCCATT GAAATACTTG GGTATAAATT GTCTGCCGAC 
GGACTGAAAA CGGAAGGCGA AGCATTCACC TTACTGAAAG ATGATAACCG CGCAGGCATG 
GAAGGACAAA GCATCCTGAA AAAAGATAAT TATTATTATC TCTTTTACTC TGCCGGCAAT 
TGCTGCGGCG GTGGATGTAC CTATTCTGTA AACGTCGCCC GCTCCACCAG CTTCAAAGGC 
CCTTATGAAT ACTTTACAGG CAACCCTGTC CTCAGTGAAA ACGACAGCTG GAAATGTATG 
GGACACGGTA CCTTCGTTAC CGCTGATGAT AATCAGACCT ACTACCTGCA CCATGCGTAC 
AATAAGAAAA GCACCGTGTT CACAGGGCGA GAAGCACTCC TCTCCCGGTT ATCCTGGCAA 
ACACCTTCTG GCTGGCCCGC ACTGAAAACA GTCGATATCA GCACAACAAC ACCGGTAGAT 
CTTTACGATC CGTTTGATGG AAAAAAAACA GAGAAATACT GGCAATGGGA CTTCCGCCAC 
TCTACCCCTT CCATACAACA ACAGAAAGGA ACGCTTCGCT TATCAGGTGT AGCAACAAAA 
GAAAATCCAG CCGGTATCGT ACTGACAGTA AGACCAACTG CCGATAACTT TGAAATGTCC 
ACCAGCGTAA CGAATCACAA CAAAGCCCTC AAGGGACTGG TCATCTATGG GGACGCAAAC 
GCCGCCATTG GTATCGGTGT AGAAGGAGAC AGTGTAAAAG TCTGGAAAAC TGAAAACAAA 
CAACGTATCA CCATAAAGGC AGCCGCTGTG CCGTCCTCCG CTATCGGACT GAAAATAGCC 
ATGTCTGGCG GCAGCAACTG CGAGTTCTTT TATCAAACGG ACGACGCTAC CTGGATACCG 
CTGGCTACCG GCTTAGCAAC AGGATCTTTA GCGCAATGGG ACAGAAGTCC ACGACTGGGT 
CTGCAATACA GCGGCAATAA AAACGAAAAC GCGCAGTTTG CCTTCTTCAG ATTGCACAAC 
AAATAA

Protein sequence

MYRTKKYLAL LLSFVCLSMC ATLHAQSTTG PVIAGDLADP SIIKVDSVYY ATGTSSEWAP 
YYPVYKSSNL KDWRQTGYVF DKAPDWTVGS FWAPEYYQIG DTYYMYYTAR RKSDNQSFIG 
VATSRYPDHG FIDHGVIIEH GKEAIDAFIY DDNGQRYITF KAYGLENRPI EILGYKLSAD 
GLKTEGEAFT LLKDDNRAGM EGQSILKKDN YYYLFYSAGN CCGGGCTYSV NVARSTSFKG 
PYEYFTGNPV LSENDSWKCM GHGTFVTADD NQTYYLHHAY NKKSTVFTGR EALLSRLSWQ 
TPSGWPALKT VDISTTTPVD LYDPFDGKKT EKYWQWDFRH STPSIQQQKG TLRLSGVATK 
ENPAGIVLTV RPTADNFEMS TSVTNHNKAL KGLVIYGDAN AAIGIGVEGD SVKVWKTENK 
QRITIKAAAV PSSAIGLKIA MSGGSNCEFF YQTDDATWIP LATGLATGSL AQWDRSPRLG 
LQYSGNKNEN AQFAFFRLHN K