Gene Smed_1230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1230
Symbol
ID	5322077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1311269
End bp	1312345
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	60%
IMG OID	640790171
Product	patatin
Protein accession	YP_001326915
Protein GI	150396448
COG category	[R] General function prediction only
COG ID	[COG3621] Patatin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.17654
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.350334
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCACG AGGCTCCGCC GAAGCCGAGA TCGCGAAGGT CTGAAGGAAC ACGTCCGGAT 
CTCCGTCCTC CGCTTCCCTG GCATTCCGGC GACATGCGCA TACTCTCGAT CGACGGAGGC 
GGGATACGTG GAATCTTGCC GGCGGCCGTG CTCGCCCATT GCGAAGATCG CTTCTGCAAC 
GGACGGCCTG CAGGCGAGTT CTTCGATTAT CTCGCCGGAA CGTCCACCGG AGGCATCATC 
GCGCTTGGCC TTTCGATCGG GCTCTCCGCG AAAGACATCC TTTCGATCTA CATGGACCAC 
GGCGCGGAGA TCTTCCCTCC CCGCCGCCAC TATCGAAACC GGACAATACG CAAACTTCAG 
TCGGCATGGC ACTTTCTGCG TAACTTGAAC CAGTACAAGT ACGAGCGAGA GGCGCTGCGA 
CGGAATCTTG CAGCGACTTT CGGCGAGAGA CTGCTCGGTG ACGCTGAACG GCGGTTGGTG 
ATCCCGTCCT TCGACGAATA CAACGAGGTG CACCTCTTTA AGACCCCTCA TCATCCGGAC 
TACCAGCGTG ACTGGAAGGA GAGGATGATC GATGTCGCGC TGTCGACTTC GGCCGCCCCG 
ACCTTCTTCT CGACTTACCG AAACGGCGAC CGGCATTTTG CGGATGGAGG GGTCTGGGCC 
AACAACCCGG TGATGACCGC CCTCGTAGAT GCCCTCGCCT GCCACGAGAT TGATCGCAGG 
AACGTCCAGG TACTGTCACT AGGATGCATC GAGTCTGACT TCGCGTTTTC CGAGGGGCAG 
ATATCGAAAG GCGGTTTGTG GCATTGGAAG GAAATCATCT CTTCCGCCAT GAGGTTGCAG 
AGCCAGAATG CGCTGGGACA AGCTGGGCTT TTGTTAGGCC GCGATCACCT TCGACGAATC 
GACGGCGCGC CGATGACGGA TGACCCCATC GTTCTCGACG ACTACCAACG CGCCGCCGCA 
GAGCTCCCTG CAATCGCGAG GCGCCTGGTC GATGACAACA GCGAGCGCCT GGCTCACTTC 
TTCAGTCAAC CGCGACCTCC GTTCGACGCT TTTCATGGCC CCAGGCACAC GGACTGA

Protein sequence

MQHEAPPKPR SRRSEGTRPD LRPPLPWHSG DMRILSIDGG GIRGILPAAV LAHCEDRFCN 
GRPAGEFFDY LAGTSTGGII ALGLSIGLSA KDILSIYMDH GAEIFPPRRH YRNRTIRKLQ 
SAWHFLRNLN QYKYEREALR RNLAATFGER LLGDAERRLV IPSFDEYNEV HLFKTPHHPD 
YQRDWKERMI DVALSTSAAP TFFSTYRNGD RHFADGGVWA NNPVMTALVD ALACHEIDRR 
NVQVLSLGCI ESDFAFSEGQ ISKGGLWHWK EIISSAMRLQ SQNALGQAGL LLGRDHLRRI 
DGAPMTDDPI VLDDYQRAAA ELPAIARRLV DDNSERLAHF FSQPRPPFDA FHGPRHTD