Gene Sare_1027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1027
Symbol
ID	5708258
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1149989
End bp	1151365
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	58%
IMG OID	641270544
Product	MmgE/PrpD family protein
Protein accession	YP_001535928
Protein GI	159036675
COG category	[R] General function prediction only
COG ID	[COG2079] Uncharacterized protein involved in propionate catabolism
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0490086
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGGGAAC TGGAGAAGAA GCTGGCACGG CATACGCGAA AGTTTGTTGA CCGGCCGATG 
ACGCCGGACG AACTGCAGGT GATCAAGCGT AGTGTCGCTG ACTCTTACGC GGGAATCTGC 
GCCTCATTAG TCGACACTAC CATCCTGCGT AAATTCAGTA AGGTCGTCAC GGGCCCTGGG 
GCGGGATCCG GAACTCCGGT CTGGGGTGTT GGACGGGAAT CCAGTATAGA CGATGCCGTT 
TTTCTCAACG CTATTCTGGC TCGCAGGAGT GATCTACTTA ACACGTATGT CTCACCCACC 
GCGATGGGCA TCGTGCATCC GTCCGACAAC GTGGCCCTCG CGTTGGTTCT TGCCGATTGG 
TTGAGATGGA CCGGTAAACA GTTCCTCGCT TCGGTAAATG TTTTGTTCAA TCTTTCCGCC 
CGATTCGCCG ATAGTTATGA TCCTGAGGCG AGTGGCTTTG ACCATGATGC CGCCGCCACT 
TTCTGGGTCG CACTCGCCGT AGGACAGGCG CTCGGCCTCT CCGAGGCTCA GCTTGTCGAG 
GCACAACGCA TCGCCGGCGA GTTCGGGCTC ACCGCCAATC AGGCTGCGGT AGGCGACATC 
ACTGATTGGA AGCACTGTAC CTACGCGTCC AGCGCCCTGC GGGGCCTACA GGCCGCCAGG 
CTGGCCCGGG CGGGGTTCAC AGGGCCAGCC TCAATATACC AGGGTAAGTT CGGCGTGAAT 
CGATTCTACA GAAGTGCCGA AATGGCGTTC GATGTTGAGC CCGACCTCAA TAGGATCATC 
TTTAAGCGGT GGCCGGCGCT CTTCTACTGC CAAACTCCAA TTGACGTCGC ACGTGATCTG 
TCCTCCAACA TTAGCGAGGC CTCGGATATC CGACAGGTGA AGGTGGAGAC CTACGATCGG 
GCCCTACGAA ATGGCGCCAC ATCATCAGCC GACAACCCCG CCAGTCGGGC GGGCCGCACA 
CACTCTATTG CGTACTGCGT CGCCACTGCG CTTCTCAAGC CTGTCGAGTA CGCCGACTTC 
GACGCGGATC GCGCACGAGA CCCTCAACTC CAGCGGCTGT TGGGCGCGAT CAGCGTCATG 
GAGGACTCGA CTATGACCAA GAAATTCCCA TCCTGCACAC CATGTCGGAT ATCGATTACC 
TTAGAAAATG GCGAGGTCAT ACGGCAGGAA CGCGACTACT CGCACGGCGA CCCCAGGGAC 
CCCCTGTCTC GCGACGAAAT TTCGGACAAG GTACGTAGAA ACCTTACGGG CCTGGCGAGC 
ACTTTCAGCA AGAACAAGAT CATCTCCTGC CTATGGGGTG CGGAGAAGCT CGATGGGTTG 
GCGGCCCTAC GGGCTCCGTT AGAACAGGAC CGGACAAAAG GGAGCGTATG GGAGTGA

Protein sequence

MGELEKKLAR HTRKFVDRPM TPDELQVIKR SVADSYAGIC ASLVDTTILR KFSKVVTGPG 
AGSGTPVWGV GRESSIDDAV FLNAILARRS DLLNTYVSPT AMGIVHPSDN VALALVLADW 
LRWTGKQFLA SVNVLFNLSA RFADSYDPEA SGFDHDAAAT FWVALAVGQA LGLSEAQLVE 
AQRIAGEFGL TANQAAVGDI TDWKHCTYAS SALRGLQAAR LARAGFTGPA SIYQGKFGVN 
RFYRSAEMAF DVEPDLNRII FKRWPALFYC QTPIDVARDL SSNISEASDI RQVKVETYDR 
ALRNGATSSA DNPASRAGRT HSIAYCVATA LLKPVEYADF DADRARDPQL QRLLGAISVM 
EDSTMTKKFP SCTPCRISIT LENGEVIRQE RDYSHGDPRD PLSRDEISDK VRRNLTGLAS 
TFSKNKIISC LWGAEKLDGL AALRAPLEQD RTKGSVWE