Gene Sare_1669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1669
Symbol
ID	5703439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1920656
End bp	1922524
Gene Length	1869 bp
Protein Length	622 aa
Translation table	11
GC content	67%
IMG OID	641271173
Product	secreted protein
Protein accession	YP_001536548
Protein GI	159037295
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.180028
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.687449
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCT CCCACCCACG CCGACACACA CGGCGGAGCC TGGCGCTCGG TCTCGCGCTG 
GCAACGGCCG TCACCGCCAC GGCCCCCAGC ACCGCCACCG CCGGCCCACC CCGGTCCGGC 
ACCCCCGACT TCGGCCCCAA CGTGACGATC TTCAGCCCGG ACACGCCCAT CGACGAGATC 
CAGGCAACCA TGGACGCACG GCACGCCGCA CAGGTGGACG CCGAGATGGG CACCGACCGA 
CACGCATATC TCTTCCTACC CGGCGACTAC GGCAACACCG AACAGCCGTT GCAGGTGAAG 
CTCGGCTACT ACACCCAGGT GTCCGGCCTC GGTGCCACCC CCACCGACGT CCGGGTCCAC 
GGAAAGATCG AAGTCTACAA CCGCTGCCTC GACGACGGCA CCAGCAACTG CCTCGCACTG 
GTCAACTTCT GGCGGACACT GTCCAACCTG GCGCTGACCA TCGACTCCGC CGACCAGGAC 
GACTGTCGGT CCTCAGCGAA CTTCTGGGCG GTGTCGCAGG CCGTATCGAT GCGCCGCCTG 
GACGTCAGCG GCGGCACCCT GTCGCTGATG GACTACTGCA CCGCCGGCCC GCACTACGCC 
AGCGGCGGAT TCATCGCCGA CTCACGACTA CCCGACGTCG TCAACGGCTC ACAACAGCAG 
TGGCTGACCC GCAACAGCGA GATCGGCAGC TGGTCCAACG CCGTGTGGAA CCAGGTCTTC 
GCGGGTGTCA TCGGTGCGCC GGACGACGCC GGCTTTCCCG ACCCGCCATA CACCACCCTC 
GGCACCACGC CACTGAGCCG GGAAAAGCCG TACCTGTTCG TTGACGATCG GGGCCGTTAC 
CAGGTGCGAG TGCCGGCTGC TCGCCGTGAC ACCCGGGGCA TCTCCTGGGA TGCGGGGCAC 
GCGCCCGGCC GAAGCATCGC GATCCGCGAC TTCTACATCG CCCGTCCCGG TGATTCCGTA 
CGTACCATCA ACCAGGAGTT GGCTCGGGGC AAGCATCTCC TGCTCACCCC CGGCCGGTAC 
GACATCGCCC AGAGCATCAG GATCCGCCGG CCGGACACGG TCGTCCTCGG CCTGGGACAC 
GCCACGCTGA CCGCCGTGGA CGGTGCGATG CCGCTCGACA TCGCCGGCGT TCCCGGTGTC 
GTGGTAGCCG GGGTGACGGT CGACGCCGGG CTCCAGGAGT CGCCGGTGCT GCTCCGGGTC 
GGCGAACGAC ACGGACGCCA CCACAGCACC CCGCGGAACC CGATCACGCT GTCCGACGTG 
TACTTCCGGG TCGGCGGGCC GCACATCGGT CGGACCCACA CCGCGCTCGA AATCAACAGT 
GACCACGTGC TGATCGACCA CACCTGGGTG TGGCGAGGCG ACCACGGCGT CGAGGACTTC 
ACCGACGGGG TCAAGGGTGA CACCGATCGC TGGCACACCA ACACCGGCCG GTACGGTGCA 
ATCATCAACG GCGACCGGGT CACCGCCACC GGTCTGTTCG TCGAGCACTT CCAACGCCAC 
AACACGGTGT GGAACGGTGA ACACGGCACC ACGATCCTCT ACCAGAACGA ACTGCCCTAC 
GACCCGCCCA CGCAGGCCGA CTGGATGAAG GGCGACGTCG AGGGCTGGGC CGGCTACAAG 
GTCGGCGACC GGGTACGGCA CCACACGCTG TACGGCGGCG GGGTGTACGT GTACAACCGG 
AACAACCCGT CGATTCATAC TGAGAACGGC TTCGAGGTGC CGGACCGCCC CGGGGTACGG 
CTTCATCACG TGATGACCGT GAACCTGAAC GCCGGCACGA TCGACCACGT GGTCAACGGG 
ATCGGTGCGG CGGCCGACAC CACGCGCGTC GGTGCGCCGG TCTACCTCAC CGAGTATCCG 
ATCGATTGA

Protein sequence

MTTSHPRRHT RRSLALGLAL ATAVTATAPS TATAGPPRSG TPDFGPNVTI FSPDTPIDEI 
QATMDARHAA QVDAEMGTDR HAYLFLPGDY GNTEQPLQVK LGYYTQVSGL GATPTDVRVH 
GKIEVYNRCL DDGTSNCLAL VNFWRTLSNL ALTIDSADQD DCRSSANFWA VSQAVSMRRL 
DVSGGTLSLM DYCTAGPHYA SGGFIADSRL PDVVNGSQQQ WLTRNSEIGS WSNAVWNQVF 
AGVIGAPDDA GFPDPPYTTL GTTPLSREKP YLFVDDRGRY QVRVPAARRD TRGISWDAGH 
APGRSIAIRD FYIARPGDSV RTINQELARG KHLLLTPGRY DIAQSIRIRR PDTVVLGLGH 
ATLTAVDGAM PLDIAGVPGV VVAGVTVDAG LQESPVLLRV GERHGRHHST PRNPITLSDV 
YFRVGGPHIG RTHTALEINS DHVLIDHTWV WRGDHGVEDF TDGVKGDTDR WHTNTGRYGA 
IINGDRVTAT GLFVEHFQRH NTVWNGEHGT TILYQNELPY DPPTQADWMK GDVEGWAGYK 
VGDRVRHHTL YGGGVYVYNR NNPSIHTENG FEVPDRPGVR LHHVMTVNLN AGTIDHVVNG 
IGAAADTTRV GAPVYLTEYP ID