Gene Sare_2064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2064
Symbol
ID	5703275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2364092
End bp	2365372
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	69%
IMG OID	641271551
Product	major facilitator transporter
Protein accession	YP_001536922
Protein GI	159037669
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.230072
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTCG GGGAGTCCCT GCAGTCGGAT TCGGTGACGA CGTCGCGTCC GAGCCCGGAG 
CGGCTGAACG CCTCCTTCTG GCGGCTGTGC TCTGCGTCAG CGGCATCGAA TCTCGCTGAC 
GGGATCGTGA AGGTTGGTCT GCCGCTGGTT GCCGTCGGCC TCACCGACTC GCCGGTGCTG 
GTGGCCGGGG TGGCGATGGC CTTCAGCCTG CCGTGGCTGC TGGTCGCGCT GCCGGCTGGA 
GCGTTGGTCG ATCGACTCGA CCGCCGAAAG GTAATGTTGG CCGCCAACAC GCTGCGCGCA 
GCGTTGTTCG GTGCGACGGC ACTGGCCGTG ACACTGGGCG TTACGTCGAT CTGGCTTCTC 
TACGTGGTGG CTTTCGGCGC TGGCGTGGCC GAGACACTGT ATGACACCTC GGCCCAGTCG 
ATCCTGCCGC AGGTGGTCGC ACGGGACGTG TTGCCGCAGG CCAATGGGCG GCTCCACTTC 
GTCGAGTTGG CCGCCAACCA GTTCGTGGGC CCGCCGCTGG CCGGTTTCCT GGTAGCTGGC 
GGCGCGGCTC TGGCCGTGGC CGGGCCAGCG GGGCTATGGG CGGTCGCGGT CGCAGCGCTG 
CTCCTCGTCC GTGGCCGTTA CCGGGTCGAG CGGGACAGGC CGACCGCCTT GCGCGCCGAC 
ATCACAGAGG GGTTGCGGTT CCTTTGGCGG CACCGCCTGT TGCGCACCCT GGCGGTGATG 
GTAGGCGGCA GCAATTTCAC CACGAGCGCG GTCCTCGCGG TGCTGGTGCT CTACGCGGTC 
GGCTCCGACT CGGCGATGGG GCTCACCGAG CCCGGGTACG GGCTATTGCT CACCGCCCTC 
GCCGGCGGCA TTATGCTCGG ATCGTTGGTC GCCGCGCGGA TAGAGCGCTG GCTTGGTCGG 
CCCCTCTCCC TCGGTACATC CCTGCTCGCC TGCGCTGCGG TCGTCGGCAT CCCGGCGTTG 
AGCACCAACC CGTTCGTACT CGGCGCGGTC TTCCTTGCCG GCGGGGTTCT GATCGCCACA 
TGGAACGTCA TCACGGTGTC GCTACGCCAA CTGATCACCC CGGACCGGCT GCTCGGTCGG 
GTCAACAGCG GCTACCGGAT GCTTGCCTGG GGCAGTCTGC CCCTCGGCGC GGCCGCCGGC 
GGCCTGTTGG CCGAGTGGTT CGGCCTTCGC GCCGTCTTCG CGATCATGGG CGTGCTGGCG 
CTCAGCCTGC TACTCGGCAT GTTCTGGGTC ACCGACTCCG CGATCCACGC CGCCGAGCGC 
GACGCTGACC GACAGGAGTA G

Protein sequence

MTVGESLQSD SVTTSRPSPE RLNASFWRLC SASAASNLAD GIVKVGLPLV AVGLTDSPVL 
VAGVAMAFSL PWLLVALPAG ALVDRLDRRK VMLAANTLRA ALFGATALAV TLGVTSIWLL 
YVVAFGAGVA ETLYDTSAQS ILPQVVARDV LPQANGRLHF VELAANQFVG PPLAGFLVAG 
GAALAVAGPA GLWAVAVAAL LLVRGRYRVE RDRPTALRAD ITEGLRFLWR HRLLRTLAVM 
VGGSNFTTSA VLAVLVLYAV GSDSAMGLTE PGYGLLLTAL AGGIMLGSLV AARIERWLGR 
PLSLGTSLLA CAAVVGIPAL STNPFVLGAV FLAGGVLIAT WNVITVSLRQ LITPDRLLGR 
VNSGYRMLAW GSLPLGAAAG GLLAEWFGLR AVFAIMGVLA LSLLLGMFWV TDSAIHAAER 
DADRQE