Gene Cpin_2849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpin_2849
Symbol
ID	8359010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chitinophaga pinensis DSM 2588
Kingdom	Bacteria
Replicon accession	NC_013132
Strand	+
Start bp	3514520
End bp	3516031
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	48%
IMG OID	644965029
Product	sulfatase
Protein accession	YP_003122529
Protein GI	256421876
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000585259
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCAAA GAAATAAATA CCATATCATA CTATTGCTGG CTGCGCTATG CGCTTTATCC 
GGATCGGGTG TAACTGCCCA GTCAAAGCCC AATATTATCC TCTTGTATGC AGATGACCTG 
GGATATGGTG ACGTAGGTTG TTATGGCGCG TCGGCAGTAA AAACACCGAA TATCGACCGT 
CTTGCCAGTA AAGGAGTACG ATTTACAGAT GCGCATTGTA CAGCGGCTAC CTGTACGCCA 
TCAAGACTGT CCTTACTGAC AGGCACTTAT GCTTTTCGAA AGAAAGCAGC TATCCTTCCT 
GGTGATGCGC CTTTGCTGAT CCCACCGGAT ACGTATACTT TACCACGTAT GTTACAGCAG 
GCAGGGTATA CGACCGCCGT GATCGGTAAA TGGCACTTAG GATTGGGGAA CGGCGTTATT 
AACTGGAATG ATAACATTGG TCCGGGGCCG AATGAGATAG GTTTTGACTA TTCGTTTATT 
ATTCCGGCTA CTACTGACCG GGTACCTACT GTCTTTGTGG AGAATGGAAG GGTACCTGAC 
CTGGATCCCA ATGATCCTAT TGCTGTGAGT TATGCCGCGA TGATCGGGGA TGAACCTACC 
GGACTCTCAG ATCCACAATT GCTGAAGCAA CGGGCAGATA CACAGCATAG CAATACGATT 
ATTAACGGCA TCAGCCGGAT CGGTTTCATG ACCGGTGGCA AGCGTGCCCG TTGGGTAGAT 
GAAGAGATCC CGATGGTGTT GAACGGAAAG GCGAAAGACT TCATAACTAC GCATAAAGAG 
CAGCCGTTTT TCCTTTATTA TCCTTTCCCT AACATCCATG TACCGCGTAC ACCGAATAGG 
AAATTTGCCG GTACTACGGC ACTTGGCGCC CGTGGAGACG TCATTGCAGA AATGGACTGG 
TTAGTGGGAG AGATCACACA GCTGTTGGAT TCACTGGGAA TCGCGAAAAA TACACTGATT 
GTATTCAGTA GTGATAATGG TCCTGTATTA GACGATGGCT ATGAAGACCA GGCCGGACAA 
CTGAACAAAA GTCATAAACC GGCAGGGATA TTCAATGGTG GGAAATACAG CGCATTTGAA 
GCCGGTACCC GGATGTCTAC CATTACCTAC TGGCCGGGTA CTATACGTCC TGGTGTTTCA 
GCGGCTTTGT GTTCGCAGGT AGACCTGATG GCTTCTTTTG CAGCATTGAC AGGACAAAAA 
TTACCTGCAG GCGCTGCACC TGACAGTCAG AATGCGCTGG ACGTATGGTT GGGCAAGTCA 
GTACAGGGCA GGAAATACCT GCTGGAAGAA TCTTACACCC TGGCGTTGCG GGATAAAAGG 
TGGAAGTATA TCGCTCCTCA GACGACGCCT ACGCCTGACT GGATGAAAAA CAAGGAAATA 
GCTACCGGAC TGTCACCTGT GGAACAACTA TACGATCTGC ATAAGGATCC CGGAGAAACG 
CATAATCTCG CCGGCCAACA TCCGGAAATC ATAAAGACAT TGAAAGCTGA ACTGAAAAAA 
CTGACACTAT GA

Protein sequence

MEQRNKYHII LLLAALCALS GSGVTAQSKP NIILLYADDL GYGDVGCYGA SAVKTPNIDR 
LASKGVRFTD AHCTAATCTP SRLSLLTGTY AFRKKAAILP GDAPLLIPPD TYTLPRMLQQ 
AGYTTAVIGK WHLGLGNGVI NWNDNIGPGP NEIGFDYSFI IPATTDRVPT VFVENGRVPD 
LDPNDPIAVS YAAMIGDEPT GLSDPQLLKQ RADTQHSNTI INGISRIGFM TGGKRARWVD 
EEIPMVLNGK AKDFITTHKE QPFFLYYPFP NIHVPRTPNR KFAGTTALGA RGDVIAEMDW 
LVGEITQLLD SLGIAKNTLI VFSSDNGPVL DDGYEDQAGQ LNKSHKPAGI FNGGKYSAFE 
AGTRMSTITY WPGTIRPGVS AALCSQVDLM ASFAALTGQK LPAGAAPDSQ NALDVWLGKS 
VQGRKYLLEE SYTLALRDKR WKYIAPQTTP TPDWMKNKEI ATGLSPVEQL YDLHKDPGET 
HNLAGQHPEI IKTLKAELKK LTL