Gene Sare_4765 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4765
Symbol
ID	5707482
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5393124
End bp	5394812
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	72%
IMG OID	641274163
Product	hypothetical protein
Protein accession	YP_001539509
Protein GI	159040256
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000030187
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGAGCCAGG TCCTGCGGAT CGGCAACGCC TCCGGCTTCT ACGGCGACCG CTTCACCGCC 
TGGCAGGAGA TGCTCGACGG CGGTGCCCTG GACGTTCTCA CCGGCGACTA CCTTGCCGAG 
CTGACCATGC TCATTCTGGG TCGGGACCGG ATGCGTGACT CCGACCTCGG GTACGCACGG 
ACGTTCCTAC GCCAACTCGA GGGCACCCTC GGCACCGCAC AGGAACGCGG CGTGCGGATC 
GTCACCAACG CCGGGGGGCT GAACCCCGCG GGGTTGGCCG CGGCCATCCG GTCCCTCGCC 
GAACGGCTCG GGCTCGACGT CAGGGTCGGG TACGTCGAGG GCGACTCACT CCCCCGGCCG 
GACGCGCTGA CCGCGAACGC GTACCTCGGT GCCTTCGGAA TCGCCGCCGC GTTCGACGCC 
GACGCCGACG TGGTGGTCAC CGGACGAGTC ACCGACGCGT CCCTGGTGGT CGGGCCGGCG 
ATCGCCCGGT TCGGCTGGGG CCGCGACGAC CTGGACGCTC TCGCCGGCGC GACCGTCGCC 
GGGCACCTCC TCGAATGCGG CGCGCAGGTG ACCGGCGGCA ACTTCAGCTT TTTCACCGAG 
CTACCGGACG GCGGGCACCG GCCTGGCTTC CCCGTCGCAG AGCTGCACGA CGACGGCTCG 
TCGGTGATCA CCAAGCACCC GGGCACCGGG GGCGCGGTCA CCGTCGAGAC GGTCACCGCC 
CAACTCCTGT ACGAGGTGGG CGGGCCGGCG TATCTCGGGC CGGACGTGAT CACCCACCTG 
GACACGGTGC GCCTCGCCCC GGACGGGCCG GACCGGGTCC GGGTGTCCGG GGTCCGGGGG 
ACGCCGCCAC CAGAAACCCT CAAGGTCGGC GTCAACAACC TCGGCGGCTT CCGCAACTCC 
ATGACCTTCG TGCTCTGCGG GCTGGACATC CCGGCGAAGG CCGCCCTGGT CCGGAGGCAG 
CTCGAGGAGA CCGTCGGCAA GGAGGGGTTG GAGTTCGTCC TCGCCCGCAC CGACCACCCC 
GACACCGCCG ACACCGAAAC GGCGAGCGCC CTGCTGCACG TACACCTCCG CGACGGGGAC 
AAGGCACGGG CCGGCCGGGC CTTCTCGGCC GCGGCGGTGG AGCTGGCGCT GGCCTCGTAC 
CCGGGGTGCA CCCTGACCAC CCCGCCCGGC GACGCGACAC CGTACGGGGT CTTCACCGCC 
GACACGGTCG CGCAGGACGC GGTCGCGCAC GTGGCCGTGC TGCCCGACGA CACCCGCGTG 
CCGATCCCCC CGCCCTCACT GAGGCGGTCG GCGGAGCCCG CTGTCGGGCC CTCGGTGTCG 
ACCGGGAGCC CCTCCTCGTA CCCGACCCGG CGCGGGACGC TCGGGGACGT GGTGGGAGCC 
CGGTCGGGGG ACAAGGGGGG TGACGCCAAC CTGGGCGTCT GGGCACGAAA CGACGCGACC 
TGGGCGTGGC TGCGGGGCTG GCTGACCGTG GAGCGACTCG CTGAGCTGCT GCCGGAGACC 
TCCCCGCTGA CTGTCGAACG TCACGAACTG CCGAACCTGC GGGCGGTCAA CTTCGTGATC 
CGGGGGCTGC TCGGGCCGGG GGTGGCTGCC ACGACTCGCT TCGATCCGCA GGCGAAGGCA 
CTGGGTGAGC TACTCCGGTC CCGCGTGGTC GACGTTCCCG CCGGTCTGAT CTTGGAGGCG 
ACATCATGA

Protein sequence

MSQVLRIGNA SGFYGDRFTA WQEMLDGGAL DVLTGDYLAE LTMLILGRDR MRDSDLGYAR 
TFLRQLEGTL GTAQERGVRI VTNAGGLNPA GLAAAIRSLA ERLGLDVRVG YVEGDSLPRP 
DALTANAYLG AFGIAAAFDA DADVVVTGRV TDASLVVGPA IARFGWGRDD LDALAGATVA 
GHLLECGAQV TGGNFSFFTE LPDGGHRPGF PVAELHDDGS SVITKHPGTG GAVTVETVTA 
QLLYEVGGPA YLGPDVITHL DTVRLAPDGP DRVRVSGVRG TPPPETLKVG VNNLGGFRNS 
MTFVLCGLDI PAKAALVRRQ LEETVGKEGL EFVLARTDHP DTADTETASA LLHVHLRDGD 
KARAGRAFSA AAVELALASY PGCTLTTPPG DATPYGVFTA DTVAQDAVAH VAVLPDDTRV 
PIPPPSLRRS AEPAVGPSVS TGSPSSYPTR RGTLGDVVGA RSGDKGGDAN LGVWARNDAT 
WAWLRGWLTV ERLAELLPET SPLTVERHEL PNLRAVNFVI RGLLGPGVAA TTRFDPQAKA 
LGELLRSRVV DVPAGLILEA TS