Gene Caci_2637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_2637
Symbol
ID	8333986
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	3020694
End bp	3022091
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	69%
IMG OID	644955788
Product	Ricin B lectin
Protein accession	YP_003113394
Protein GI	256391830
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.352697
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTCC CCATCCGCGG CAAGCGCTTC GGAGTCTGGC TCGCCGTGAT TCCGACCGCG 
GCCGTGACCG TGGCGGCGGC CGGCGGCATA GCCATGGCCA CCGGGAGCGC GTCCGCGCAG 
GCTGCGGCGT CGTACCCGGC CCACTACTCC GCGCCGTATC TCCAGCTCGA CGGTTCGGAC 
TCCGGTGACA TGGTCGCCGA CATGAACGCC AGCGGCGACA AGTTCTACAC GCTGGCCTTC 
CTGACGCCGA AGTCCGGCTG CACGGCGCAG TGGGAGGGCG GCGGCGAGGC GATGAACGCC 
TTCACCTCGC AGGTCACCAC CCTCAAGAAC GACGGCGGCA ACGTCATCCT CTCCTTCGGC 
GGGGAGCCGA ACGGCAACAC GCCGAACGAG ATCGCGCAGA CCTGTACCAG CGTCAGCTCG 
CTGACGGCCG CGTACCTGAA CATCGTCAAC ACCTACGGCG TCAACCGGCT CGACTTCGAC 
ATCGAGGGCA GCGTGCTGGC GGACACCGCG GCGACGAGCC GCCGGGACCA GGCGCTGGCC 
GCGCTCCAGG CCGAGGACCC GGCCGTGCAG ATCGACTTCA CGCTCGCCGT CGATCCCGGC 
GGTCTGCCCA CCGGCAACGC CTCGGAGTAC GCGCTGCTCC AGGACGCGAA GAACGCGAAG 
GTCAAGGTCA GCGTCGTGAA CATCATGACG ATGGACTTCT ACGACGGGAA GTCCGTGCTC 
TCCGACGCCG AGTCCGCGGC GAAGGCGACC GCGGGCCAGC TCGCCGGGCT CTACGGCGTC 
TCGACCTCGG CCGCCTACGG CATGATGGGC CTGACCCCGA TCGCCGGCAC CAACGACGAC 
GGCGCCCCCT TCAGCCAGGC CAACGCCTCC AGCCTGGAGT CCTTCGCGGC TTCCAACGGT 
GTGCAGGAGC TGGCCTTCTG GGAGGTCGAC GGCTACGACA AGGGCACCGG CTACGCCTAC 
TCCAAGATCT TCCAGAAGAT CGCGAGCGGC GGCACGACCC CGCCGCCCCC GACCGGTCAC 
ACCGTCGTCA ACAACAACTC CGGGACCTGC CTGAGCGTGT CCGGCGCGTC GACCTCGCCC 
GGCGCCACCG CTGACATCTA CACCTGCAAC AGCAGCCCGG GGCAGAGCTG GACGGTGAAC 
AGCAACGGCA CGATCACCGG CAACGGCTCG GGCCTGTGCC TGAGCACCTC CGGGAACAAC 
CCCGCCCTGA AGACCACCGC GGACATCAAC ACCTGCGACG GCGACGCCTA CGAGAAGTGG 
ACCGTCTCCG GCGGCACGAT CGTCAACGGC GCCTCGGGCC TGTGCCTGAG CATCACCGGC 
GGTGCCACCG CGAACTACTC CCTCGCCGAC CTGTACACCT GCAACGGCAG CGTCAGCGAG 
AACTGGACCG TCGGCTGA

Protein sequence

MKVPIRGKRF GVWLAVIPTA AVTVAAAGGI AMATGSASAQ AAASYPAHYS APYLQLDGSD 
SGDMVADMNA SGDKFYTLAF LTPKSGCTAQ WEGGGEAMNA FTSQVTTLKN DGGNVILSFG 
GEPNGNTPNE IAQTCTSVSS LTAAYLNIVN TYGVNRLDFD IEGSVLADTA ATSRRDQALA 
ALQAEDPAVQ IDFTLAVDPG GLPTGNASEY ALLQDAKNAK VKVSVVNIMT MDFYDGKSVL 
SDAESAAKAT AGQLAGLYGV STSAAYGMMG LTPIAGTNDD GAPFSQANAS SLESFAASNG 
VQELAFWEVD GYDKGTGYAY SKIFQKIASG GTTPPPPTGH TVVNNNSGTC LSVSGASTSP 
GATADIYTCN SSPGQSWTVN SNGTITGNGS GLCLSTSGNN PALKTTADIN TCDGDAYEKW 
TVSGGTIVNG ASGLCLSITG GATANYSLAD LYTCNGSVSE NWTVG