Gene Sare_1507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1507
Symbol
ID	5703492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1736531
End bp	1737502
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	65%
IMG OID	641271013
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001536394
Protein GI	159037141
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1175] ABC-type sugar transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000203032
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGTCACT CGGCCGCCAC GGCTCCGCCG ACACCAACTG CACCACCAGC CCCGCCGGGC 
GGCGCCCGGG AACGTCGACG GTTCACCCTG GACCGCCTGG ACCTCACCTA CTCGCCGTAC 
GTCTACATCG CGCCGTTCTT CCTGATCTTC GGCGCGTTCG GGCTGTACCC GATGGCGCGT 
ACCGCCTGGA TGTCGTTGCA CGACTGGGAC ATGATCGGCG AGCGCACCTT CATCGGGTTG 
GACAACTACA CCCGGTTGCT GTCCGACGAC TACTTCTGGA ACGCGCTGGT CAACACGTTC 
GGCATCTTCG CCCTGTCGAC CATCCCACAG CTGCTGCTGG CGCTCTTTCT GGCGAACCTG 
CTCAACCGCA CCCTCCTGCG GGCCAAGACC TTCTTCCGGA TGGCCATCTT CATCCCGAAC 
GTCGTCTCGG TGGCCGCGGT CGCGATCGTC TTCGGCATGC TCTACCAGCG CGAGTACGGG 
CTGGTCAACT GGCTGCTCGG CTTCGTTGGG ATCGACCAAA TTGACTGGGA TGGGCAGACC 
TGGAGCTCCT GGACGGCGAT CGCGTCCATG GTCAACTGGC GGTGGACGGG GTACAACACC 
CTGATCCTGC TCGCCGGCAT GCAGGCCATC CCTCGGGACC TCTACGAGGC GGCCGAGATC 
GACGGTGCCG GCCAGTGGCG GCAGTTCTGG CGAATCACCC TGCCCCTGCT CAGGCCGACG 
TTCGTCTTCG TGGTCATCCT CTCCACGATC GGCGGCATGC AGCTGTTCAC CGAACCGCTG 
CTCTTCGCCA ACGGCAGCAT CATCGGCGGC AACCAGCGCG AGTTCCAGAC CCTGGCCATG 
TACATGTACG AGATGGGGCT GGTGAACCTC AACAGTGCCG GTTACGGGGC CGCCGTCGCC 
TGGGCCCTCT TCATGATTAT CGGCCTGATG TCGCTGCTCA ACTTCGTCCT CGTCCGCCGC 
GCGGCCACGT GA

Protein sequence

MSHSAATAPP TPTAPPAPPG GARERRRFTL DRLDLTYSPY VYIAPFFLIF GAFGLYPMAR 
TAWMSLHDWD MIGERTFIGL DNYTRLLSDD YFWNALVNTF GIFALSTIPQ LLLALFLANL 
LNRTLLRAKT FFRMAIFIPN VVSVAAVAIV FGMLYQREYG LVNWLLGFVG IDQIDWDGQT 
WSSWTAIASM VNWRWTGYNT LILLAGMQAI PRDLYEAAEI DGAGQWRQFW RITLPLLRPT 
FVFVVILSTI GGMQLFTEPL LFANGSIIGG NQREFQTLAM YMYEMGLVNL NSAGYGAAVA 
WALFMIIGLM SLLNFVLVRR AAT