Gene Sare_5091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_5091
Symbol
ID	5704059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5763000
End bp	5764379
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	71%
IMG OID	641274483
Product	band 7 protein
Protein accession	YP_001539824
Protein GI	159040571
COG category	[S] Function unknown
COG ID	[COG2268] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000550559
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCCCTCG TCATCGCCAT CGCCGGCGCC GCGGCGCTGT TCCTCGTCCT CGTGCTCTTC 
GTGCTCTCCC GGATCAAAGT CGCCGGACCC AACGAGGCGT TCATCGTGAC CGGGCGCAAG 
GGCCGCACCA CCCGCACCGC CGAAGGTGGC CGCTCCACCG ACATGTCCGG GCAGAAGGTG 
GTACTCGGCG CCTCGGTCTT CGTGCTGCCG GTGGTGCAGA AACTCCAGTC CGTCGACCTG 
TCCAGCCGCC GGATCGACGT CGGCATCAAG GGCGCGGTCA GCAAGCAGGG CATCCGTGCC 
GAGCTGCACG GCGTCGCCAT CGTCAAGGTC GGCGGCACCG AGAACGCGAT CCGTGCCGCC 
GCCCAACGGT TCCTGCGCCA GCAGGACGAG ATCGAGGACT TCACCCGGGA GGTACTGGCC 
GGCGCGCTGC GCTCGATCGT CGGCCGGCTC ACCGTCGAGG AGGTCATCCG GGACCGGGCG 
GCCTTCGCCA GCGCGGTGGC GGAGGAGGCC GAGCACTCGA TGACCAACCA GGGACTGGTG 
CTCGACACGT TCCAGCTCCA GGACATCCTG GCCGAGGGGT CCTACCTCGC GGACCTGGGC 
CGACCGGAGG CAGCCCGGGT ACTCAAGGAC GCGGCGATCG CCGAAGCCCG TGCCCGCCAG 
CAGGCCGAAC AGGAACGGCT GCTCGCCGAG GAGGCCATCG CCGTGGCCAA CCGCAACCTC 
GCCCTGAAGC AGGCGTCGAT CCAGTCCGAG ATCGACGCCG CCAAGGCGAA GTCGGCGGCG 
GCCGGGCCGC TCGCCCAGGC CGAACGGGAC CAGGCGATTC TCTCCGAGCA GCAGAAGGTG 
GCCGAGCGCA ACGCCGAGCT CAAGCAGCGC CAGCTCGACA CCGAGGTGCG CAAGCCGACC 
GACGCCGCCC GGTACAAGGT CGAGCAGGAG GCTGAGGCCG CCCGCAACGC CGCTGTGCTG 
AACGCCGACG CCCAGCGCCA GGCGGTCATC GCCGCCGCCG AGGCCGCCGA GCGGGAAGGT 
CAGGCCGAGG CCGCGACCAT CCTGGCCCGG GGCCAGGCCG AGGCCGAGGC GATGGCCCGC 
AAGGCCGAGG CGTTCACCGC GTACGGTGAG GCGGCCGTCC TGGATCTGCT GGTCAAGGTG 
CTGCCGAAGG TCGTCGAGGC AGCCAGTGCG CCGATCGGCG CGATCGACAA GATGACCGTC 
ATCTCCACCG ACGGGGCGTC GTCGCTGACC AAGTCGGTAG CCGGCAACGT GGCACAGGGT 
CTCCAACTCG GCAGCGACCT GACCGGTATC GACCTGGCCG GGCTGCTCAC GCGGTTGGCC 
GCGTCGACCG GTTCGGAGCC GCACGGCACG CCGGCCGTCG ACAGCACCGA GACCCGCTGA

Protein sequence

MPLVIAIAGA AALFLVLVLF VLSRIKVAGP NEAFIVTGRK GRTTRTAEGG RSTDMSGQKV 
VLGASVFVLP VVQKLQSVDL SSRRIDVGIK GAVSKQGIRA ELHGVAIVKV GGTENAIRAA 
AQRFLRQQDE IEDFTREVLA GALRSIVGRL TVEEVIRDRA AFASAVAEEA EHSMTNQGLV 
LDTFQLQDIL AEGSYLADLG RPEAARVLKD AAIAEARARQ QAEQERLLAE EAIAVANRNL 
ALKQASIQSE IDAAKAKSAA AGPLAQAERD QAILSEQQKV AERNAELKQR QLDTEVRKPT 
DAARYKVEQE AEAARNAAVL NADAQRQAVI AAAEAAEREG QAEAATILAR GQAEAEAMAR 
KAEAFTAYGE AAVLDLLVKV LPKVVEAASA PIGAIDKMTV ISTDGASSLT KSVAGNVAQG 
LQLGSDLTGI DLAGLLTRLA ASTGSEPHGT PAVDSTETR