Gene Sare_5011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_5011
Symbol
ID	5705466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5679579
End bp	5681219
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	72%
IMG OID	641274404
Product	Na+/solute symporter
Protein accession	YP_001539745
Protein GI	159040492
COG category	[R] General function prediction only
COG ID	[COG4147] Predicted symporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000410087
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGACAACA GCTACGTCGT CCCGGCGATC GTCACGGTCA CCCTGGTCAC CGTCGGCATC 
GGCTTCTACG GTCTACGGCT CGCCCGCACC ACCTCGGACT TCCTGGTGGC GTCCCGGGTG 
GTCAGCCCGA CCTGGAACGC CGCCGCGATC GGCGGGGAGT ACCTGTCGGC CGCCAGCTTC 
CTCGGCGTCG CCGGCCTGAT CCTCACGTAC GGCGTCGACG TGCTCTGGTA CCCGGTCGGC 
TTCGCCGCCG GGTACCTGGC CCTCCTCCTC TTCGTTGCCG CGCCGCTGCG CCGCTCCGGG 
GCGTTCACCC TTCCAGACTT CTGCGAGCTA CGGCTGGGCT CCCGGTGGCT GCGCACCCTC 
GCCACCGCCT TCGTGATCTT CATCGGTTGG CTCTACCTCG TCCCCCAGTT GCAGGGTGCC 
GGGCTGACCA TGGCCACGTT GACCGGCTCG CCCTACCCGC TGGGGGCGCT CCTGGTCGCG 
GCGGTGGTCA CCGCGAACGT GGCGCTCGGC GGCATGCGTG CGATCACCTT CGTCCAGGCG 
TTCCAGTACT GGCTCAAGCT GACCGCACTC GCCGTACCGG CGATCTTCCT GGTGTTGCAG 
TGGCAGGCCG ACGCCCGCCC GGCGGTCACC CCACCGGAGG GCCCGACGTT CCGCGCCGCG 
ACCACCGTCG TGGTCGAGCA TCCCGCCACC CTCACCCTGC CCGACGGTCA GGTGCGGGAG 
GTACACCCCG GCGACGAGTT GACCTTCGCT GCGGGAGATT CGGTGCCCGA CGTGAGCGGG 
ACCGCCATCG ACGCGGCCGA CTGGTTGCTG CCCAGCACCG TCGGGAGCGA CGACCGGGGC 
CTGTTCACCA CCTACTCGCT GATCCTCGCC ACGTTCCTCG GCACCATGGG ACTGCCGCAC 
GTGCTGGTGC GCTTCTACAC CAACCCGGAT GGTGCCGCCG CCCGCCGCAC CACCCTGGTG 
GTGCTGGCCC TGGTCGGCGC CTTCTATCTG CTGCCGACCA TCTACGGGGC GCTCGGTCGG 
ATCTACACCC CGCACCTGTT GCTCACCGGG CAGACCGACG CGGTGGTGTT GCTGCTGCCC 
GGCGCGGCGC TGGGTGACGG CACCGCCGGT CGGCTCCTCG CCGCACTCGT CGCCGCCGGG 
GCGTTCGCAG CGTTCCTTTC CACCTCCTCC GGCCTGCTTA CCAGCGTTGC CGGGGTGATC 
TCCACAGACG TGCTGGGCCA CGGCTCGGTC CACGGGTTCC GACTGGCCAC GGTACTCGCC 
GGCAGCGTGC CCACGGTGCT CGCGCTCAAC GTGTCCGGGC TGGACGTGTC GCAGGTGGTG 
GGGCTGGCGT TCGCGGTGGC CGCGTCGAGC TTCTGCCCCC TACTGGTGCT GGGAATCTGG 
TGGCGGGGCC TGACCGACCG CGGCGCGGCC GCCGGAGTGT TGATCGGCGG CGGCGCCGCG 
GTCGGGGCGG TGCTGGTGAC CGTGCTCGGC CCGCCGCTGT CCGGGTGGCC GGCCACGCTC 
GTCGCGCAGC CGGCCGCCTG GACGGTTCCG CTCGCCTTCA CCGTGATGGT GGTGGTGTCG 
ATGACCACCC GTCACCGCGT CCCGACCGAC GTCGGCGCCA CGATGCTCCG CCTACACGCC 
CCCGAAGCCC TACGGCCGTA G

Protein sequence

MDNSYVVPAI VTVTLVTVGI GFYGLRLART TSDFLVASRV VSPTWNAAAI GGEYLSAASF 
LGVAGLILTY GVDVLWYPVG FAAGYLALLL FVAAPLRRSG AFTLPDFCEL RLGSRWLRTL 
ATAFVIFIGW LYLVPQLQGA GLTMATLTGS PYPLGALLVA AVVTANVALG GMRAITFVQA 
FQYWLKLTAL AVPAIFLVLQ WQADARPAVT PPEGPTFRAA TTVVVEHPAT LTLPDGQVRE 
VHPGDELTFA AGDSVPDVSG TAIDAADWLL PSTVGSDDRG LFTTYSLILA TFLGTMGLPH 
VLVRFYTNPD GAAARRTTLV VLALVGAFYL LPTIYGALGR IYTPHLLLTG QTDAVVLLLP 
GAALGDGTAG RLLAALVAAG AFAAFLSTSS GLLTSVAGVI STDVLGHGSV HGFRLATVLA 
GSVPTVLALN VSGLDVSQVV GLAFAVAASS FCPLLVLGIW WRGLTDRGAA AGVLIGGGAA 
VGAVLVTVLG PPLSGWPATL VAQPAAWTVP LAFTVMVVVS MTTRHRVPTD VGATMLRLHA 
PEALRP