Gene Sare_0501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0501
Symbol
ID	5703306
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	570992
End bp	572581
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	72%
IMG OID	641270027
Product	major facilitator transporter
Protein accession	YP_001535421
Protein GI	159036168
COG category
COG ID
TIGRFAM ID	[TIGR01131] ATP synthase subunit 6 (eukaryotes),also subunit A (prokaryotes)

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.406138
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00103191
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCCGTCGT CCCTCCGCTC CGAGCGCTCC TTCCTCGGGC GAACCGTCGG CACGGGCATC 
AAGGCCGTCC GCCTACTGCT GCGTGGCTCA GTCAGCGGCG GTCGTTGGAT GACCCAGTCG 
GCGGGACGGG CCCGCGCCCG GGGGGCCGGC CGGGAGATCG GCATGGTCCG TCTGTTCGAC 
CTGCACGCGG TCTCCTGCGC TGGCGACACG CTGATCGCAA TCGGCCTGGC CGGAACGATC 
TTCTTCAACG TGCCACTCGG TGAGGCACGC AGCAAGGTCG CGCTCTACCT GCTGGTGACC 
ATGATCCCGT TCGCCCTGCT CGCCCCCGTG GTCGGTCCGC TACTCGATCA CTTCCGGCAC 
GGCCGGAGGT ACGCCCTGGC CACCAGCATG CTCGGGCGGG CGTTCCTGGC CTGGCTGATC 
TCCGACTACA TCCACGGCTT CGGCCTGTAC CCGGCGGCCT TCGGGGTGCT GGCGCTCTCC 
CGCGCGTACG GGGTGGCCCG GTCGGCCGCC GTGCCCCGGC TGCTCCCGGA AGGGCTCGGG 
CTGTCCCAGG TCGGGGCACG GGCCAGCGTG TACGGGACAC TGGCCGGGGC CCTGGTCGCG 
CCCATCGGCC TGGCCGCCTT CTGGTTCGGG CCGCAGTGGC CCCTGCGGGT CGCCTCGGTC 
ATCTTCCTGG TCGGCATGGT CGTCGCCCTG CGGCTGCCAC CGAAGGCCGA CTCGGAGCCG 
CCCGAGCGGG TACCGCGTCC CCTGCGGGCG TTCAGGCGAG GCTCGGGTGA CCGGCCCCTG 
GGCCGCGGGC GCCCGCACGG CCGGCTGGTG ATCGCGACTC TGATCGGTGC CGCCACCCTA 
CGTGCGGTCT ACGGCTTCCT GCTGCTCTTC CTGGCCTTCG CGATCAAGGC CGGTGACCTG 
ACCACCGTCG TCCTCGGCCG AGACCTGAGC GACGAGGCCG CCCTCGGACT GGTCGGCGGG 
GCGCTGGCGA TCGGTAGCTT CCTGGCCACC GCGATCGGCA CCCGGCTGCG TATCCACCGG 
CCGGCGACGC TCCAGTCCAG CGGCATGGTG ATCATCGCTG GGGTGGCCGT ACTCGCCACA 
CTCAAGTTCT CGCTACTGAT GGTCGCCCTG CTCTGCCTGG TCGCCGCGCT GATGAGCGGA 
ATCGCCAAGC TCGCAGTGGA CGCCTCGATC CAGGAACGTA TCCCCGAACG ACTGCGCGCC 
AGCTCATTCG CCCACTCGGA GACGGTTCTC ATGCTCGCCT TCGTCGCTGG GGGTGGGCTG 
GGCCTCGTTC CGTTCGACGG TCAGCTCGGC ATCGCCGTCG CCGCCGGGGT CGCAACGCTC 
GCCACAGCCC GGGGCATCGT GGTCGCCGGC CGGCTACGGG CGGAGCGACT GGCCGGCCGA 
CCGCTGGCCG ATGACGAGCT CACCGAAGGC GACACGGACC CGGCTGAACC CGCCTCCGGC 
GACCCCGCAC CGACCTCACC CGCCCCGACA CCGGAGGCCG AGGGTGGCGA TGACCTGGCA 
CCACCGGGTT TCCACATCTA CCGCCCGTCG TCGGCGGTCG GTGGGCCCGG CGGCACCGAC 
GAAGAGACCC GCCAGGGGCC CATCCCGTGA

Protein sequence

MPSSLRSERS FLGRTVGTGI KAVRLLLRGS VSGGRWMTQS AGRARARGAG REIGMVRLFD 
LHAVSCAGDT LIAIGLAGTI FFNVPLGEAR SKVALYLLVT MIPFALLAPV VGPLLDHFRH 
GRRYALATSM LGRAFLAWLI SDYIHGFGLY PAAFGVLALS RAYGVARSAA VPRLLPEGLG 
LSQVGARASV YGTLAGALVA PIGLAAFWFG PQWPLRVASV IFLVGMVVAL RLPPKADSEP 
PERVPRPLRA FRRGSGDRPL GRGRPHGRLV IATLIGAATL RAVYGFLLLF LAFAIKAGDL 
TTVVLGRDLS DEAALGLVGG ALAIGSFLAT AIGTRLRIHR PATLQSSGMV IIAGVAVLAT 
LKFSLLMVAL LCLVAALMSG IAKLAVDASI QERIPERLRA SSFAHSETVL MLAFVAGGGL 
GLVPFDGQLG IAVAAGVATL ATARGIVVAG RLRAERLAGR PLADDELTEG DTDPAEPASG 
DPAPTSPAPT PEAEGGDDLA PPGFHIYRPS SAVGGPGGTD EETRQGPIP