Gene Sare_1698 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1698
Symbol
ID	5704009
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1960415
End bp	1961494
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	72%
IMG OID	641271201
Product	hypothetical protein
Protein accession	YP_001536576
Protein GI	159037323
COG category	[S] Function unknown
COG ID	[COG4850] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000770913
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGTCGGGG TCGGGCGGTT GTGGCAGGGT GGCCGTGTGC CACCGACTGC CGCCGGCCAA 
CTGGCCGTAC CCCAGCTGCA CCGGGCCGCG CGGATCGAGG ACGCCGTGCA CCACCTGGTC 
GAGCGGCGGC TGCGGCGGAC CGGCTGGCGG ATCCACACCG TGGCCTACCC GGGCTACGGC 
GCCCCTGGCT GGATCCGGGT GATGTGTCGG GTGCTGTTGG GGCGGCCGGA CAACCGGCAG 
CGGGGGCGGC CGGAGAAGGT TCGGGGCTGG CGCAGCTTCG CCACCCTGCC GGCCAAGTAC 
GTCACGGTGG CCATCGAGTC GGGGGACGTA CGGCACGAGA CGCGGACCGA CCGCAGCGGC 
TTCGTGGACA CGATCGTGCC GGTCGACCTG CCTCCCGGGT GGGGGTCGGT GTGGATAAGC 
GTCCCGGAGG CCGAGCCGGT CCAGGCGCCG GTACGGATCC TGGACCCGCA GGTACGGTTC 
GGGGTCATCT CCGACGTCGA CGACACGGTC ATGGTCACCA CGCTTCCGCG GCCACTTCTC 
GCCGCCTGGA ACACGTTCGT GCTGGACGAG CATGCCCGAG CCGCGGTGCC CGGGATGGCC 
GTGCTGTACG AGCGGCTGGT CACGGCCCAC CCCGGCGCCC CGGTGTTCTA CCTGTCCACC 
GGCGCCTGGA ACGTGGCGCC GACACTCACC CGGTTCCTGT CTCGGCACCT CTACCCGGCT 
GGGCCGCTGC TGCTCACCGA CTGGGGTCCG ACGGCAGACC GGTGGTTCCG CAGTGGTCGG 
GAGCACAAGC GAGCCACCCT GACCCGACTG GCCACGGAGT TCCCCGAGGT GAAGTGGCTG 
TTGGTGGGCG ACGACGGCCA GCACGACCAG GAGATCTACC GGGAGTTCGC CGTGGCCCAC 
CCGGACAACG TCGCGGGGGT GGCGATTCGC CGGCTCTCAC CGACCCAGGC GGTGCTCGCC 
GGTGCTCCGC CCAACCCGGT CAGCGACAGC GCGTCGGTTC CTCCGGTGGG GCAGAAATGG 
CTCTCCGCGC CCGACGGCGC CGGGCTGTGG CAGCTGCTGC GGGAGGCGGG TCTGGTCTGA

Protein sequence

MVGVGRLWQG GRVPPTAAGQ LAVPQLHRAA RIEDAVHHLV ERRLRRTGWR IHTVAYPGYG 
APGWIRVMCR VLLGRPDNRQ RGRPEKVRGW RSFATLPAKY VTVAIESGDV RHETRTDRSG 
FVDTIVPVDL PPGWGSVWIS VPEAEPVQAP VRILDPQVRF GVISDVDDTV MVTTLPRPLL 
AAWNTFVLDE HARAAVPGMA VLYERLVTAH PGAPVFYLST GAWNVAPTLT RFLSRHLYPA 
GPLLLTDWGP TADRWFRSGR EHKRATLTRL ATEFPEVKWL LVGDDGQHDQ EIYREFAVAH 
PDNVAGVAIR RLSPTQAVLA GAPPNPVSDS ASVPPVGQKW LSAPDGAGLW QLLREAGLV