Gene Sare_4042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4042
Symbol
ID	5705023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4598685
End bp	4600892
Gene Length	2208 bp
Protein Length	735 aa
Translation table	11
GC content	70%
IMG OID	641273468
Product	MMPL domain-containing protein
Protein accession	YP_001538823
Protein GI	159039570
COG category	[R] General function prediction only
COG ID	[COG2409] Predicted drug exporters of the RND superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.087579
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACCC TGCTCTACCG GCTCGGCCGC GGTGCGATGC GCCGACGACG CGTCGTCGCC 
GCACTCTGGC TTGTCGTACT CGCCGGTCTC GGCCTGGCGG CCCTGACCCT GCGGGGACCG 
ACGTCCAGCG ACTTCACGAT GCCCGGCACC GAGTCGCAGC TTGCGAAGGA CCTGCTCGAG 
GAGCAGTTCC CGGCCGCTAG TGGTGCCACC GGCACCATCG CGCTCAAGGC ACCACAGCCA 
GGCCTGCTCG GCACCCCGCA GGGCCAGGCG GTGGCCACCG AAGTCACCCA GGAGGCCGCG 
ACACTGCCCG GCGTGGTCGG CGCGGTGGAT CCGCTCACGG CCCAGGCCAT CAGCCCCGAC 
GGCCAGTACG GGCTGATCCA GGTCCAGTTC GCCGAGGGCG CGGACAAGGT CACCGACGAG 
CAACGGGAGG CGTACGAGCA GGTCGGCGCC GCAGCCGAGG CCCAGGGCTG GCAGGTGGCA 
CCCGGCGGCG AGGTGCTCAA CAGCGAACCG GCGGCTGGCT CGTCCGAGGT GATCGGTGTG 
GCGATCGCGG CGATCGTCCT GGTGGTCACC TTCGGCTCGC TGGTGGCGGC CGGGATGACG 
ATGCTGAACG CGCTGATCGG GGTCGGCGTC GGCATGGCCG GTCTGTACGC GCTGAGCGGC 
ACGGTCGAGT TGACCAGCAC CGCGCCGATC CTCGCCCTGA TGCTCGGCCT CGCGGTCGGC 
ATCGACTACT CGCTGTTCAT CACTTCCCGC TACCGCCAGA ACCTGCTCGA CGGATTGCCG 
CCGGACGAGG CGGTCGGCCG GGCGGTCGGC ACGGCCGGCT CGGCTGTGCT CTTCGCCGGC 
GCCACCGTGG TCATCGCGCT GACCGGTCTG GCGGTGGTGA ACATCCCGTT CCTGACCGTC 
ATGGGTCTGG CCGCTGCCGG GACGGTCGTC GTCGCCGTGC TGGTCGCCCT CACCCTTGCG 
CCGGCACTGC TCGGCTTCGC GGGCCGGCGG GTGCTCCGCC GTGAGCAACG CCACCGCTAC 
GGCATCGCCT CGGCGGAGTC CGAGACGGCC GAATCCGAGG CGGCGGCCCT CACCGAGGAC 
CGCTCCACGT TCGGCTTCCG TTGGGCTCGC CTGGTCATCC GGTTCCGGGT ACCGGTGATC 
CTGGTTGCCC TGCTCGGACT GGGCGTGCTC GCGCTGCCCA CCTCCGACAT GCGGCTGGCC 
CTCCCGGATC AGGGGACCGC ACCGGTCGGC TCGCCGGCCC GGGTCTCCAA TGACCTGATC 
AGCGAGGGCT TCGGGCCAGG CTTCACGGGT CGCCTGGCAG TCGTGGTGGC CGGGGACAGC 
CCAGAGGCGA CGGCCGCGGC CGTGCCCCAG GTCACGGCCT TGGTCCAACG GACTGACAAC 
GTCCTGGCCG TGGCGCCGCC GCAGCTCAGT CCGGATGGGC GGACGGCCCT GATCGGCGTG 
GTCCCCGAGA CCGGGCCGAC GGACCCGGCA ACCGAGACGG TGGTGGACGA CATCCGCGGC 
TCGGTCGGCG GCATCCAGGG CGCGGACGTG CTACTCACCG GGGTAACCGC GATTGGAATC 
GATGTCTCCG AAAAACTCGC CGACGCGCTG CCGGTCTACC TGCTCCTGGT GGTCGGGCTC 
TCGATCGTGC TGCTGATGCT GGTGTTCCGC TCGCTGCTGG TGCCGGTGAA GGCCGCACTG 
GGCTTCCTGC TCACCGTGGC GGCCACCTTC GGGCTCACCG TCGCGGTCTT CCAGCAGGGG 
CACCTCGCCG ACCTGGTCGG TCTGGACACA CCGGGGCCGC TGATCAGCTT CCTGCCGATC 
CTGCTCATCG GTATCCTCTT CGGCCTGGCC ATGGACTATG AGGTCTTCCT CGTCTCCCGG 
ATGCGGGAGG ATTTCGTCCA CGGCGACACT GCCCAGCAGG CCACTGTCAA CGGGATGGGT 
CACGGCGCCC GGGTGGTCAC CGCGGCCGCG CTCATCATGA TCTCCGTCTT CGGTGGCTTC 
ATCTTCATGG ACGACCCCGT CATCAAGTCG ATGGGCTTCG CGCTGGCAGT TGGCGTCGCC 
ATCGACGCGT TCGTGGTGCG GATGACGATC GTGCCGGCGG TCATGTCCCT GCTCGGCGAC 
GCCGGGTGGT GGCTGCCACG CTGGCTGAAC CGGGTCCTAC CCAACGTGGA CGTCGAGGGT 
GAGGGCCTGC GCAACCACCT GGCGGAGCAG GAACCCGCCC GCACCTGA

Protein sequence

MATLLYRLGR GAMRRRRVVA ALWLVVLAGL GLAALTLRGP TSSDFTMPGT ESQLAKDLLE 
EQFPAASGAT GTIALKAPQP GLLGTPQGQA VATEVTQEAA TLPGVVGAVD PLTAQAISPD 
GQYGLIQVQF AEGADKVTDE QREAYEQVGA AAEAQGWQVA PGGEVLNSEP AAGSSEVIGV 
AIAAIVLVVT FGSLVAAGMT MLNALIGVGV GMAGLYALSG TVELTSTAPI LALMLGLAVG 
IDYSLFITSR YRQNLLDGLP PDEAVGRAVG TAGSAVLFAG ATVVIALTGL AVVNIPFLTV 
MGLAAAGTVV VAVLVALTLA PALLGFAGRR VLRREQRHRY GIASAESETA ESEAAALTED 
RSTFGFRWAR LVIRFRVPVI LVALLGLGVL ALPTSDMRLA LPDQGTAPVG SPARVSNDLI 
SEGFGPGFTG RLAVVVAGDS PEATAAAVPQ VTALVQRTDN VLAVAPPQLS PDGRTALIGV 
VPETGPTDPA TETVVDDIRG SVGGIQGADV LLTGVTAIGI DVSEKLADAL PVYLLLVVGL 
SIVLLMLVFR SLLVPVKAAL GFLLTVAATF GLTVAVFQQG HLADLVGLDT PGPLISFLPI 
LLIGILFGLA MDYEVFLVSR MREDFVHGDT AQQATVNGMG HGARVVTAAA LIMISVFGGF 
IFMDDPVIKS MGFALAVGVA IDAFVVRMTI VPAVMSLLGD AGWWLPRWLN RVLPNVDVEG 
EGLRNHLAEQ EPART