Gene Strop_3037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3037
Symbol
ID	5059501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	3468422
End bp	3469504
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	68%
IMG OID	640475287
Product	chitin-binding domain-containing protein
Protein accession	YP_001159852
Protein GI	145595555
COG category	[S] Function unknown
COG ID	[COG3397] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.245182
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.198398
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTCCT ATCGAGCCCG AACAGCCGCG CTCCTCACCG CGGCCACGAC TCTCCTCGCG 
GCTGCCGCGG TACTCACCGT CAGGTCGGAG CCGGCGGCGG CGCACGGCGC CGCCATGGTG 
CCCGGCAGCC GTACCTTCCT TTGCTGGCAG GACGGGCTGA GCCCCACCGG GGAGATCCAA 
CCGTACAACC CCGCCTGCTC GGCGGCGGTG GACCAGAGTG GGGCGAACTC GCTCTACAAC 
TGGTTCAGTG TGCTGCGCTC CGACGCGGAT GGTCGTACCG TCGGGTTCAT TCCCGACGGC 
CAGCTGTGCA GCGGGGGAAA CCCCGGGTTC CTCGGCTATG ACCTGGCCCG CATTGACTGG 
CCACTGACGC ACCTGACCGC TGGCCAGAAC ATTGAGTTCC GCTACAGCAA CTGGGCGCAC 
CACCCCGGGA CGTTCTACTT CTATGTCACC AAGGACAGTT GGAGCCCAAC CCGTCCGCTG 
GCCTGGAGCG ACCTGGAGGA GCAACCATTC CTGACCGTCA CCAACCCACC CCAGCGCGGC 
GGTCCGGGCA CCGATGACGG GCACTACTAC TTCGCCGGAA CGCTGCCGGC CGACAAGAGC 
GGCCGACACC TCATCTACTC GCGCTGGGTC CGTTCGGACA GCCCGGAGAA CTTCTTCGGC 
TGCTCGGACG TCACGTTCGA CGGAGGCAAT GGTGAGGTGA CCGGCATCGG CCCCGGTGGC 
ACCGCCCCGC CACCGAGCCC GACCACTGCG CCGCCGAGCC CGACCACGCC GCCGCCCAGC 
GGGGACTGCA TGGCGGTCTA CAAGGTGATC AACGCATGGC CGGGCGGCTT CCAGGGGGAG 
GTCGAAATCA TGAACCACGC CGCCACCACC TGGGCCGGGT GGACGGCACG TTGGACCTGG 
CCCAGCGGCC AGTCAATAGT CCAACTCTGG AGTGGCACGC ACACCACCTC AGGCTCAGCG 
GTAGCGGTGA CCAACGCGTC ATACAACGGC ACGTTGGCAC CGGGAAGCAG GGCCACGTTC 
GGCTTCCTCG CCAGCCTCAG CGGCACGAAC ACGTCACCGA CCGTGACCTG CACCGGTAGC 
TGA

Protein sequence

MSSYRARTAA LLTAATTLLA AAAVLTVRSE PAAAHGAAMV PGSRTFLCWQ DGLSPTGEIQ 
PYNPACSAAV DQSGANSLYN WFSVLRSDAD GRTVGFIPDG QLCSGGNPGF LGYDLARIDW 
PLTHLTAGQN IEFRYSNWAH HPGTFYFYVT KDSWSPTRPL AWSDLEEQPF LTVTNPPQRG 
GPGTDDGHYY FAGTLPADKS GRHLIYSRWV RSDSPENFFG CSDVTFDGGN GEVTGIGPGG 
TAPPPSPTTA PPSPTTPPPS GDCMAVYKVI NAWPGGFQGE VEIMNHAATT WAGWTARWTW 
PSGQSIVQLW SGTHTTSGSA VAVTNASYNG TLAPGSRATF GFLASLSGTN TSPTVTCTGS