Gene Sare_4959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4959
Symbol
ID	5706481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5633165
End bp	5634433
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	68%
IMG OID	641274354
Product	major facilitator transporter
Protein accession	YP_001539696
Protein GI	159040443
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.592693
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.327663
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCCCG TGGAAGAGGC CCGCACGACC CTGCCGGCGC CGGAGGCGTC CGCCGCCCGC 
CCTGAGATCG CGCTGCTGCT GAGCGTCGTG TTTCTTGCGT ATCTGGCACA GATGACCCTC 
AACCCGATCA TCGCCCCACT CTCACGTGAG GTCGGCCTGG CCGAATGGCA GATCGGGGCG 
ACGATCAGCA TCGCCGCGGT CATGCTCGTG CTCACCAGTC AGTTCTGGGG GCGGCGCTCG 
CAGTCCTGGG GGCGCAAACC CGTCCTGGTC GCCGCGTTCA CGCTCGCGAT GGTGACGATG 
TCCCTGTTCG CCCTGCTTGC CTGGCTCGGC ATGATCGGCA CGATCGCCGG CATCGAACTG 
TTCCTGCTGT TCGTCCTGCT GCGTGGCGTC GGCTTCGGCA CCGCCATCTC CGCGGTCCTG 
CCGACGGCGC AGGCATACAT CGCCGACGTC ACCAGTGACG AGACCGCGCG CGTCAAAGGC 
ATGGCCGGCA TCGGCGCCGT TCAGGGCATT TCCATGATCG CCGGATCGGT CGTCGGTGGC 
GTCCTGTCCG TGCTCGGCGT CCTCGCTCCC CTCATCGCTG TGCCCGTGCT CCTGGCAGGC 
GGACTCATCC TTGTCGCGGT CCGCCTCCGC CGTGAACCGC GTCACCGACT GGTGGATAAG 
CCGGCCCGGG TCAGTCCACT CGATGCTCGC GTCTGGCCAT TCCTACTCGC CGGGTTCGGC 
ATGTACATGG CTCTGGGCTT TATCCAGATC CTCCTTGGCT TCATCGTGCA GGACCGGCTC 
GGACTCGACA CCGAGAGCAC CGGGCTGGTC ACCGGCGGCG CGCTGCTGCT GGCGGGGCTG 
GGCCTCATCG TGGCGCAAGC GGTGGTCGTG CCCCGCAGCC GATGGAGTCC CGCGACCCTG 
CTCCGCGTCG GCGGCGCCAT CGCCTTCGTG GGCTTCACCC TCCTCATCCC CGACGCCGGG 
GCGGCACCTT TGTTTGCCTC CATCCTGTTG ATCGGACTCG GTCTCGGCAT CGCGACGCCC 
GGCTTCACCG CCGGCCCGAC ACTCATGGTC GATCGCGACG AACAGGGCGG CCTCGCTGGA 
CTCACCACGG CAACCGTCGG CCTGACTTTC GTGATCGCGC CCACCGCCAG TACCGCTCTC 
TACGGATTCG GGGCCGCGAT ACCGATCGTC GTCGGGACGG CAGTCATGGC CGTCGTCACC 
ATCTTCGTCC TCGTTCACCC GCGCTTCCGG CGTCTCCCCG TACCAGCGCC AGGACCGCCC 
CCAGCGTGA

Protein sequence

MKPVEEARTT LPAPEASAAR PEIALLLSVV FLAYLAQMTL NPIIAPLSRE VGLAEWQIGA 
TISIAAVMLV LTSQFWGRRS QSWGRKPVLV AAFTLAMVTM SLFALLAWLG MIGTIAGIEL 
FLLFVLLRGV GFGTAISAVL PTAQAYIADV TSDETARVKG MAGIGAVQGI SMIAGSVVGG 
VLSVLGVLAP LIAVPVLLAG GLILVAVRLR REPRHRLVDK PARVSPLDAR VWPFLLAGFG 
MYMALGFIQI LLGFIVQDRL GLDTESTGLV TGGALLLAGL GLIVAQAVVV PRSRWSPATL 
LRVGGAIAFV GFTLLIPDAG AAPLFASILL IGLGLGIATP GFTAGPTLMV DRDEQGGLAG 
LTTATVGLTF VIAPTASTAL YGFGAAIPIV VGTAVMAVVT IFVLVHPRFR RLPVPAPGPP 
PA