Gene Sare_3485 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3485
Symbol
ID	5703548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4018755
End bp	4020374
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	67%
IMG OID	641272912
Product	chitinase
Protein accession	YP_001538278
Protein GI	159039025
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3325] Chitinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.686156
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0640253
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAGAT CGCTTCGCCG GGCCCTCTGG GCTGGCGCCG TGGTCGTGTT GGCGGCCGCG 
GCTGTTCCGA TGGCCTCGGC CTACGGGGCC GGCAGTGTCA CCGCCACGTT CGACAAGGTG 
CAGGACTGGG GGACCGGCCA CCAGACGAAG GTGACGGTCA CCAACGGCTC GGACACGTCG 
GTGAGCGACT GGCGTATCGA GTTCGACCTC CCCGCCGGGA CCAGCATCGG CACCTTCTGG 
GACGCCGACG TCACCCGCAC CGGGAACCAC TACGTCGCGG TCAAGAAGAG CTGGGCCGGC 
CCCCTCGCCC CAGGTGCCAG CTTCAGCTGG GGCTACAACG GGACCGGCCC CTACCAAGCG 
CCACTGAACT GCACGATCAA CGGTGCCACC TGCTCCGGTG GTGCCCCGCC GACAACGGCA 
CCCCCCACAA CCGCACCCCC CACAACGGCG CCGCCGACGA CCGCGCCCCC AACGACCCCG 
CCGCCGACCA CCTCACCCCC AGGTGGTGAC CACAAGGTCG TCGGCTACTT CGCACAATGG 
GGCGTCTACG CGCGCAACTA CCACGTCAAG AACATCCACA CCAGCGGCTC GGCGGCGAAG 
CTGACCCACA TCATGTACGC GTTCGGCAAC ACCACCAATG GACGCTGCAC GATCGGCGAC 
AGCTACGCCG ACTACGAAAA GGCGTACACC GCGGCGGACA GTGTGGACGG GGTCGCGGAC 
ACCTGGGACC AACCGTTGCG GGGTAGCTTC AACCAGCTGC GCAAACTCAA GGAGATGTAC 
CCGCACCTCA AGGTGATCTG GTCCTTCGGT GGCTGGACCT GGTCCGGCGG GTTCACCCAG 
GCGGCGCAGA ACCCGGCTGC GTTCGCCGAG AGCTGCTACA ACCTGGTCGA GGACCCGCGC 
TGGGCGGACG TCTTCGACGG CATCGACATC GACTGGGAGT ATCCGAACGC CTGTGGCCTC 
ACCTGCGACT CCAGCGGGCC GGCGGCATTC AAGAACGTGG TGAACGCGCT GCGTTCACGG 
TTCGGCCCAT CGGCTCTGGT CACCGCCGCG ATCACCGCTG ACGCCAGTAA CGGTGGCAAG 
ATCGACGCTG CCGACTACGC CGGCGCGGCA CCGAACCTCG ACTGGATCAT GGCGATGACC 
TACGACTACT TCGGTGCCTT CAACCCGCAG GGCCCGACCG CCCCGCACTC GCCGCTCTAC 
TCGTACCCCG GCATCCCGCA GCAGGGGTTC TGGTCCGACG CGGCGATCCA GAAGTTGAAG 
AGCAAGGGCG TTCCGGCCGA CAAGCTGCTG CTCGGCATCG GCTTCTACGG TCGGGGCTGG 
ACCGGCGTCA CCCAAACCGC GCCGGGTGGT TCCGCCACCG GGGCCGCGCC GGGAACCTAC 
GAGCAGGGCA TCGAGGACTA CAAGGTCCTC AAGAACACCT GCCCGGCGAC CGGGATGGTC 
GGCGGTACGG CGTACGCCAA GTGTGGCAAC AACTGGTGGA GCTATGACAC CCCCGCCACC 
ATCGGCGGCA AGATGACCTA CGCGAAGAAC GAGGGCCTCG GCGGCGCGTT CTTCTGGGAG 
CTCTCCGGCG ACACGACCAA CGGTGAGTTG ATCGGCGCGA TCAAGGGCGG TCTCGGCTAG

Protein sequence

MKRSLRRALW AGAVVVLAAA AVPMASAYGA GSVTATFDKV QDWGTGHQTK VTVTNGSDTS 
VSDWRIEFDL PAGTSIGTFW DADVTRTGNH YVAVKKSWAG PLAPGASFSW GYNGTGPYQA 
PLNCTINGAT CSGGAPPTTA PPTTAPPTTA PPTTAPPTTP PPTTSPPGGD HKVVGYFAQW 
GVYARNYHVK NIHTSGSAAK LTHIMYAFGN TTNGRCTIGD SYADYEKAYT AADSVDGVAD 
TWDQPLRGSF NQLRKLKEMY PHLKVIWSFG GWTWSGGFTQ AAQNPAAFAE SCYNLVEDPR 
WADVFDGIDI DWEYPNACGL TCDSSGPAAF KNVVNALRSR FGPSALVTAA ITADASNGGK 
IDAADYAGAA PNLDWIMAMT YDYFGAFNPQ GPTAPHSPLY SYPGIPQQGF WSDAAIQKLK 
SKGVPADKLL LGIGFYGRGW TGVTQTAPGG SATGAAPGTY EQGIEDYKVL KNTCPATGMV 
GGTAYAKCGN NWWSYDTPAT IGGKMTYAKN EGLGGAFFWE LSGDTTNGEL IGAIKGGLG