Gene Sare_1632 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1632
Symbol
ID	5703476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1870041
End bp	1871057
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	71%
IMG OID	641271140
Product	chitin-binding domain-containing protein
Protein accession	YP_001536515
Protein GI	159037262
COG category	[S] Function unknown
COG ID	[COG3397] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAAAGC GCTTTGCCCT GCCATTGATG ACGATGGGAG CTGTCACGGC CACGATGGCC 
GTCGCCGCGC CCGCCCAGGC GCATGGCTAC GTTTCGGGAC CGCCCAGCCG TCAGGCGCTC 
TGCGCGCAGG GTTCGGTACC CGACTGTGGG CCCATCTCGT TCGAGCCGCA GAGCGTCGAA 
GGACCAAAGG GCCTGACGAG CTGCAGCGGC GGCATCTCCG AGTTCGCCGT GCTCGACGAC 
GAGAGCCGGG CCTGGCCCGC GGCCACGGTC GGCCGGTCGG TCACCTTCGA CTGGATCAAG 
ACCGCCCCGC ACAAGACCAG CAACTGGGAG TACTTCATCG GCGACGAGCT GTTGGCCACG 
TTCGACGGTG GTGGCGTGCA GCCGCCGTCC ACGCTCTCGC ACACGGTCGA CCTGGGCGAC 
CACGTGGGCC GGCAGAAGGT TCTCGCGGTG TGGAACATCG CCGACACCCC CATGGCGTTC 
TACTCCTGCA TCGACGTGAA TATCGACGGC GGCCCTTCGC CGACGCCGAC GGGCACCGCG 
TCGCCGACCC CGACCGCCTC GCCGACGAGC ACCGCGTCAC CGACCCCGAC CGCCTCACCG 
ACGAGCACCG CCTCGCCGAC CCCGACCGCC TCGCCGACGA GCACCGCGTC ACCGACCCCG 
ACCGGCACGC CGTCTCCGAC CTCGACCGGG ACTCCCGCGC CGGAAAGCTG GCAGGTCGGT 
ACCACCTACC AGATCGGTGA CGAGGTGACG TACGACGGGG TGAGCTACCG GGCTCGGCAG 
GCGCACACCG CGACACCCGG GTGGGAGCCG CCGCGCGTAC CAGCGCTCTG GACTGCCGTG 
ACACCACCAC CCGCGACCGG CGACCCGGCA CCCGGCGACG GTTGGGCGGT TGGCATCGCC 
TACCAGATCG GTGACGAGGT GACGTACGAC GGGGTGAGCT ACCTGGCTCG GCAGGCGCAC 
ACCGCGACAC CCGGGTGGGA GCCGCCGCAC GTGCCGTCGC TGTGGATCCG AATCTGA

Protein sequence

MRKRFALPLM TMGAVTATMA VAAPAQAHGY VSGPPSRQAL CAQGSVPDCG PISFEPQSVE 
GPKGLTSCSG GISEFAVLDD ESRAWPAATV GRSVTFDWIK TAPHKTSNWE YFIGDELLAT 
FDGGGVQPPS TLSHTVDLGD HVGRQKVLAV WNIADTPMAF YSCIDVNIDG GPSPTPTGTA 
SPTPTASPTS TASPTPTASP TSTASPTPTA SPTSTASPTP TGTPSPTSTG TPAPESWQVG 
TTYQIGDEVT YDGVSYRARQ AHTATPGWEP PRVPALWTAV TPPPATGDPA PGDGWAVGIA 
YQIGDEVTYD GVSYLARQAH TATPGWEPPH VPSLWIRI