Gene Sare_2666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2666
Symbol
ID	5706977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3041119
End bp	3042357
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	70%
IMG OID	641272124
Product	major facilitator transporter
Protein accession	YP_001537494
Protein GI	159038241
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.178731
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000246371
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGACCCCAC GTCGGGAACT GATCGCACTC GTCGGAGCGG ACCTGCTGTC CAACCTCGGC 
AGCCGGATCT CGATCCTCGC CATCCCCTGG CTGGTGCTGG AGACAACCGG TAGCCCGGCG 
AAGATGGGTG TGGTCGCCGC CGCCGAGACG CTGCCCTACC TCCTCTCCAG TGCCCTCGGG 
CCACCGCTCG CCGACCGCAT CGGCCTACGC CGCACCTCGA TCCTCGCCGA CCTGGGTAGT 
GCCGGTTTGA TGGTGGCGGT GGCACTCACC CCGTGGCTTG GCTTCGGCGC CCTGGTCGCC 
CTGGTCGCCC TGGTCGGCAC GCTGCGCGGG GTCGGCGACC GGGTCAAGCA CGTCATGTTC 
CGCCCGGCCG CGCAAGCTGC CGGAGTGCGG CTGATCCGGC TGACCTCGGT CTACGACGGA 
ATGTCCCGGC TGACCACCCT CCTCGCGGCG AGCATTGGCG GCCTGCTCAT CTGGTGGCTC 
GGGGCCACGT CGGCGATTCT CGTCGACGCG TCGACCTTCG CGGTCTGCGC GCTCCTGATC 
TCCACGCTGG TACGCCGCAC CACTGGTGGG GCGGCAGGTT CGAGGCCGGA AAGCTACCTG 
CGGGCACTCG CTGGCGGCCT CCGGTATCTC GGGCAGGACC GGACGGTGCT CACCATGCTG 
TTGGTGATCT CCGCGCTGAA CATGGTGGTG AACGCGAGTA TCGCGGTCTA CATCCCGCTC 
TGGGTCAATG ATGTGCTGGG CAACCCGGCC GGGCTGGGGC TGGTGCTCGG TGCCTTCGCA 
GCCGGAGCCC TGCTGGGCAA CCTGCTGTTC ACCACATTCG GCTCGCGGCT ACGTCGGGAT 
CTGACGTTCG CGATCGGCGC CGCGGTCAGT GGCCCACCCC GGCTGCTGGT CCTGGCCCTC 
AGCGACGACC TCACGGTGGT GTTCGCGGTG ACCTTCGTTT CTGGGGTCGG TATCGCGGTG 
GTCAACCCAC TGCTCGGGGT CGCGCTGTAC GAGCGTCCTC CGGCCGACCT CCAGTCCCGC 
GTGATCGGGC TGGCCGGTGC ACTCGCCTTC GCCGGCCTGC CCCTGGGTGC CCTGCTCGGC 
GGCTGGTCAG TCACCACGCT CGGCCTCGAA CCCGCGCTGG TGACCGCGGC CGTGTTCGTC 
CTCGCCGTCA CCGCGGTTCC CCTCGCCGCC GCCCTACGTC CGATGCCGAA GCAGGCACCG 
TTGGTCGACG TCTCCGACCG CGAACGGGTT CCCTCGTAG

Protein sequence

MTPRRELIAL VGADLLSNLG SRISILAIPW LVLETTGSPA KMGVVAAAET LPYLLSSALG 
PPLADRIGLR RTSILADLGS AGLMVAVALT PWLGFGALVA LVALVGTLRG VGDRVKHVMF 
RPAAQAAGVR LIRLTSVYDG MSRLTTLLAA SIGGLLIWWL GATSAILVDA STFAVCALLI 
STLVRRTTGG AAGSRPESYL RALAGGLRYL GQDRTVLTML LVISALNMVV NASIAVYIPL 
WVNDVLGNPA GLGLVLGAFA AGALLGNLLF TTFGSRLRRD LTFAIGAAVS GPPRLLVLAL 
SDDLTVVFAV TFVSGVGIAV VNPLLGVALY ERPPADLQSR VIGLAGALAF AGLPLGALLG 
GWSVTTLGLE PALVTAAVFV LAVTAVPLAA ALRPMPKQAP LVDVSDRERV PS