Gene Sare_0709 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0709
Symbol
ID	5707913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	788069
End bp	789217
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	73%
IMG OID	641270227
Product	hypothetical protein
Protein accession	YP_001535619
Protein GI	159036366
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.878616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000307412
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGGTGTGA GTGACGTGCT GGCGCGGCTG GCCGTCCGGC AGGCCCACGT GTTGGTCGTC 
GAGGCGGTCG GGCACTGGCT GACCCGCGTC GCCGTCGAGC GGCTCACAAG TGCCCGGGGG 
TGGCACCTGG CAGTGTCGCC AGCGGACGCC GACATCCTGG CCGTATGCGG ATCGACCGGA 
CCCGAGCTGA CGCGGGCACT GGCAAGCCTG TGGGACCAAT TCCCGGGACC ACGTGCCCGG 
ATCGACGTCG CGTCGCCCGA TCGGGCGGCC GCGGCCCTGG AGCACGCCGA GGCCGCGCTA 
CGAAGCACGG TGCGTCAACA GGCGGACAGT AGCGCCCGTG CCGGGCATGG GACCGACGAC 
GGCGATCGCC CGCCAGCCCG GCACGACGAT CATCCGGCAG CACCGCACGG CGACCATCCG 
GCAGCTCAGC ATGCCGGCAC CGACACCGGC GCGGCCCAGT CTCCCCCGGG CGGAGGCATC 
GCCCTGGCCC ATGGCGGCGA GGATCGGGAC GGGCTCGAGA TGGACGTGCT GCACGTGCGG 
CTCGGTCCAG TGTTGCCGGC CTGGCCGACC GGTCTGGTCC TGCGCTGTCA CCTGCATGGC 
GACGTCATCG GCGAGGCGCA GGCGTGCGTC GTCGACGCTG CGCAGCGCGG TCACGCGGCC 
GGTGGCAACA GGACCAGCAA GGCTGGGCCG GACGCCGGAG AGTTCGCCGC CCGACGCTGC 
GACAACGTGG CCCGAGTGCT GGCGTTGGCG GGCTGGTCGG ACGCAGCCGG ACGGGCCCGC 
GTCGTCCGTG ATCTGCTGCT CGCTGACAAG CGGTCGGCTG CGGCCACCGA GTTGGAGCGG 
CTGAGGCGTC AGCTCCGCCG ATCACGGCTG CTGCGCCTGT CGCTGCGACG GGTGGGACCG 
CTCGGCCCTG GCGAACTCAC CCGGCTGCGG CTTGCCCCGG AACTCGCCGG TGACGTATGG 
GATCGGCTCG ACGGCATGCT CGACCGGGCG GACCGCGCGG TCAGCGGTGG AACCGGCGCC 
GTCACGGCCC TGCCGGTCAC ACCCCCGGAG GCGGTGGCCA GCGTGGTGTC CGGGTGGGAT 
GTGGCCACCG CACGGCTCAT CGTGGCCAGC CTCGACATCG ATGTGCTGGG TGCGGTGTCC 
GATGGCTGA

Protein sequence

MGVSDVLARL AVRQAHVLVV EAVGHWLTRV AVERLTSARG WHLAVSPADA DILAVCGSTG 
PELTRALASL WDQFPGPRAR IDVASPDRAA AALEHAEAAL RSTVRQQADS SARAGHGTDD 
GDRPPARHDD HPAAPHGDHP AAQHAGTDTG AAQSPPGGGI ALAHGGEDRD GLEMDVLHVR 
LGPVLPAWPT GLVLRCHLHG DVIGEAQACV VDAAQRGHAA GGNRTSKAGP DAGEFAARRC 
DNVARVLALA GWSDAAGRAR VVRDLLLADK RSAAATELER LRRQLRRSRL LRLSLRRVGP 
LGPGELTRLR LAPELAGDVW DRLDGMLDRA DRAVSGGTGA VTALPVTPPE AVASVVSGWD 
VATARLIVAS LDIDVLGAVS DG