Gene Sare_4889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4889
Symbol
ID	5707541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5544594
End bp	5545943
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	72%
IMG OID	641274284
Product	major facilitator transporter
Protein accession	YP_001539629
Protein GI	159040376
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.295208
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGAGC GCACCGTGCC CACTGTCCGG TGGGCCGCGA TCTGGCTCGG CCAGCTCGTC 
TCGCTGGTCG GGTCGAGCCT CACCGCGTTC GTCCTCGGGG TCTGGGTCTA TCAGCGCACC 
GGCTCGGTCA CCCAGTTCTC CCTGATCTTC CTTGCCGCGA CCCTGCCGGC GGTACTGTTC 
GCGCCGTTCG CCGGGGCGCT TGCCGACCGC CGGGACCGCC GGGGTCTGAT GCTGGTCGCC 
GACACCGTCG CCGCCGCCGG CACGGCGGCG CTCGCCGCGC TGGTCGTCGC CGACGCCCTC 
CAGGTCTGGC ACATCTACCT GGGGACCGCG GTGACCGCGA CCGCGTCCAC CGTGCATCAG 
GTCGCCTACC AGGCGATGAC CCCGGCCCTG GTCGGCAAGC GACATCTGGG CCGGTTCAAC 
GGCCTGATGC AGGTCTCCCG CGCGGTTCAG ATCGCCGCAC CACTGATCGC CGGGGTGCTC 
GTGGTGACCG TCGGGATCGG CGGGGTCATG GCGATCGATC TGGGTACCTT CGTGGTCGCG 
GCGTCGACCC TGCTGCTGGT CCGGCTGCCT GCCGACGTGA CACGCCCGGC CGAATCCGGT 
CCCGCCGAGG CGGTGCTGCG GGGAGCCGCC GCCGGCTGGC GCTATCTGCG GCAACGGCCG 
GGCCTGCTCC AGCTCATGGT GGTCTTCGGT GCGTACAACT TCCTCTTCGG CATCGCCGGG 
GTCCTGGTGC AGCCGCTGAT CCTCTCGTTC GCCACGGCGG ACACCCTCGG CCTGCTGATG 
TCCGTCGGGG GTGCCGGCCT CTTCGCCGGC AGCCTGGTGA TGGGGGTGTG GGGCGGGCCG 
ACCCGTCGGG TCACCGCCGT CTGCGGTGGA CTCGCGGTCG GGGGCGTGGC TCTCGTCCTG 
CACGCGGCGG CCCCGTCCGC CTGGCTGATC GGGGTGGTGG CCCCGCTGTT CCTCTTCACC 
CTGCCGATCG TGAACAGCTC CACCATGACC CTGATCCAGA CCAAGACCGA ACCCTCCGTG 
CTGGGCCGGG TGCTCGCCAC CGCCCGGGTG ATCGGCGACG CCAGCGTGCC CCTGGCGTAC 
GTGTTGGCCG GGCCGATCGC CGATGGTCTC TTCGAGCCGA TGCTGCGCCC GGAGGGTGCG 
CTCGCTGATT CGGTGGGCCG GGTGATCGGC ACGGGGGAGG GCCGCGGCAT CGCGCTGCTC 
TTCGCGGTCA CCGGGGTGGC GATGGTGTTC CTCGCTGTGC TCGCCTGGAC CCGGCCGGTG 
CTGCGCGGCG CGGATGATCT ACCCGACGCC CTTCCCGACG ACGCCCCGGA CCCCGAGACC 
GTCTCTGCCG ACCGTCAACC CGCCACGTGA

Protein sequence

MAERTVPTVR WAAIWLGQLV SLVGSSLTAF VLGVWVYQRT GSVTQFSLIF LAATLPAVLF 
APFAGALADR RDRRGLMLVA DTVAAAGTAA LAALVVADAL QVWHIYLGTA VTATASTVHQ 
VAYQAMTPAL VGKRHLGRFN GLMQVSRAVQ IAAPLIAGVL VVTVGIGGVM AIDLGTFVVA 
ASTLLLVRLP ADVTRPAESG PAEAVLRGAA AGWRYLRQRP GLLQLMVVFG AYNFLFGIAG 
VLVQPLILSF ATADTLGLLM SVGGAGLFAG SLVMGVWGGP TRRVTAVCGG LAVGGVALVL 
HAAAPSAWLI GVVAPLFLFT LPIVNSSTMT LIQTKTEPSV LGRVLATARV IGDASVPLAY 
VLAGPIADGL FEPMLRPEGA LADSVGRVIG TGEGRGIALL FAVTGVAMVF LAVLAWTRPV 
LRGADDLPDA LPDDAPDPET VSADRQPAT