Gene Cpin_5903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpin_5903
Symbol
ID	8362084
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chitinophaga pinensis DSM 2588
Kingdom	Bacteria
Replicon accession	NC_013132
Strand	+
Start bp	7497298
End bp	7498863
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	49%
IMG OID	644968042
Product	glycoside hydrolase family 28
Protein accession	YP_003125522
Protein GI	256424869
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5434] Endopolygalacturonase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.672596
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGT TACTGACTGC CACCCTGCTA TGCTTCAGCC TGTCGGCCGC TGCCCAGTTG 
AACGTCCATG TCCCCACCAT CGATGAAGTA GGCGCCACCA GGCTTCCCGC TAACATAGCT 
CCCGTGCATG CCCCTTTTTC AGTACCGGCT TTTAAAAAAC CCATATTCCC GAAATACACG 
ATCACCATCA AGGGACAGGG AAGCGCACAA ACAAAAGAGA TCCAGCAGGC CATTGACGCC 
GTTAGCAAAA AAGGCGGCGG AACAGTTATC ATACCTGCGG GCAACTGGCA TTCAGGCCGT 
ATCGCGTTGA AATCCAACGT CAATCTCCAC CTGGAAGAAA ACGCGGTACT GGAGTTCGGT 
GGAGAAATAA GAGATTATCT CCCTGTGGTC TTCACCCGTA CGGAAGGGGT CGAGGTCATG 
TCTCTCGGCG CCTGTATCTA TGCGAACGGA CAACATAATA TTGCCGTAAC CGGCAAAGGG 
AAACTGGTTG GTCCGCCGGC CAATTGTCCT GTCAGAAAAC AGGTCATGCG CCAGGATGTG 
ATAGAAAATG TCGTAGCTGC CAATAAACCG GTCTCGCAGC GGATATATGA TGGCCATGAT 
GGCGGTCCTG TGTACCTGCC AATGTTCGTT TCTGCCGTCA ACTGTAAAAA TGTTTATTTA 
GAGGGCTTGC AACTGGAAAA TACCCCTTTC TGGAACATTG TCCCTATCTA TTGCGATAAC 
GTCATTATAC GGGGTATAAC CGTCAATTCT GTCGGTATTC CCAGCGGTGA CGGTATTGAC 
ATTGAATCCA GCAAAAATGT ACTGATAGAA TATTGTACGC TGAACTGCGG CGATGACTGC 
TTTACATTAA AAGCCGGTCG CGGAGAGGAC GGTTTACGTA TCGGCAAACC AACAGAAAAC 
GTCGTTATCC GCTATTCACT GGCACGGCAG GGACACGGTG GCATCACCGT TGGCAGCGAA 
ACAGCTGCCA TGATCCGGAA CCTGTATGTA CATGATGTAG TTTTTGACGA TACAGAAGTT 
GGTCTCCGTT TTAAAACAAG ACGTCCGCGC GGCGGTGGTG GTGAAAACCT GCACTATGAA 
CGTATCCGTA TGCGCCTGCG GCTCGATGCT TTCAGATGGG ATATGCTGGG CGCAAGAATG 
TATGTAGGCG CGCTGGCTGA TCGCCTGCCC GCCTTACCTG TCAATAAACT GACGCCGGTA 
TACAGGAACA TTTACGCTAA AGACATTGTG GTAGACAGCG CGAGAGCGCT GGTAAGAGTG 
GATGGTATTC CGGAATCACC TATGACAGGC TTTCACCTGC AAAATGTAGA AGCGCATTGT 
ACGAAGTTCT TACAGAGTAT AGACGCCAAT GTTATCAGTA TCTCCAACGC AAACATATAT 
ACAACAGATT CCGCTGTAAC ACTGACCGAT AGCAGGAATA TTACTTTTGA TAAGGTACAC 
GTTATCAACC CCGCCAATAA AGTCGTGGTG AATATTTCCG GAGAACTGAC CGATAATATA 
CGCTTTAGTA ATTCTGTACC GGAGAAACCC GAAGGCTGGG AAACCGCTAC CTGGAAGAAG 
AATTAA

Protein sequence

MKKLLTATLL CFSLSAAAQL NVHVPTIDEV GATRLPANIA PVHAPFSVPA FKKPIFPKYT 
ITIKGQGSAQ TKEIQQAIDA VSKKGGGTVI IPAGNWHSGR IALKSNVNLH LEENAVLEFG 
GEIRDYLPVV FTRTEGVEVM SLGACIYANG QHNIAVTGKG KLVGPPANCP VRKQVMRQDV 
IENVVAANKP VSQRIYDGHD GGPVYLPMFV SAVNCKNVYL EGLQLENTPF WNIVPIYCDN 
VIIRGITVNS VGIPSGDGID IESSKNVLIE YCTLNCGDDC FTLKAGRGED GLRIGKPTEN 
VVIRYSLARQ GHGGITVGSE TAAMIRNLYV HDVVFDDTEV GLRFKTRRPR GGGGENLHYE 
RIRMRLRLDA FRWDMLGARM YVGALADRLP ALPVNKLTPV YRNIYAKDIV VDSARALVRV 
DGIPESPMTG FHLQNVEAHC TKFLQSIDAN VISISNANIY TTDSAVTLTD SRNITFDKVH 
VINPANKVVV NISGELTDNI RFSNSVPEKP EGWETATWKK N