Gene Smed_5076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5076
Symbol
ID	5319378
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	22476
End bp	23675
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	64%
IMG OID	640776856
Product	diaminopropionate ammonia-lyase
Protein accession	YP_001313788
Protein GI	150377193
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01747] diaminopropionate ammonia-lyase family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0463571
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTCTGC TCAATAACCA TCCCGAATAC AGGCAACCAC TCGATCCGGC CGATGCTGAA 
ACGCTCGGTG TTGCCGCAGC CAATAAGGTC GAGAGGTTTC TCTCATTCCG TGAAAATCAT 
GCCGAGACGC CACTGGTGGC CCTGCCGCGG CTGGCGGCCG AGATCGGGGT TAGCGCGATT 
CACGTCAAGG ACGAAGCTTA TCGTCTCGGG TTGGGGAGCT TCAAAGCATT GGGCGGCGCC 
TACGCCGTGA TCCGGCTGCT TCTCGAGGAG GCAGGAGAAA GCCTCGGGCG CGCGGTTGAC 
GTTTCCGAAC TGTATTCAGC CGAAGTCCGC CCGGTCGCGT GTTCCATGAC CTTTGCCTGC 
GCAACGGACG GTAATCACGG TCGCTCGGTC GCCCAAGGCG CTCAGCTCGT CGGGGCCAAG 
GCGGCGATCT TCGTACACGC CGGTGTGAGC AAGGAACGTG TCGCCGCGAT CGCCCGGTTC 
GGGGCGGAGA TAATCGGGGT TGATGGCTCT TATGATGACT CCGTGCGCGA ATCCTCGCGC 
GTCGCGGAGG CGAATGGCTG GACAGTCGTT TCGGACACCT CATGGCCGGG ATATGAGCGT 
ATCCCGGGCC TGGTCATGCA GGGTTACGTG GCGCTTGTTC GCGAATCCTT GCGCCAAATG 
CCGGAACCGC CGACGCATGT GTTCATTCAG TCGGGCGTTG GCGGAATTGC CGCGGCTGTG 
GCTGGGCATC TGGCGGTCGA GCTTGGCGCC AGGCGTCCGA CCTTCACGGT GGTCGATCCT 
GCCCGCGCAG CCTGCATCGT CGAGACGGCG CGCGCGGGAC GTCCGGTGAC TATTGCCCAT 
GGCGAACCGA CCGTCATGGC GATGCTCGAA TGCAACACCC CCTCGCTGCT GGCCTGGCGC 
ATTCTCGCGC GCGCTGCCGA TGCCTTCATG ACGGTGGACG AAGACGACGC AATTTCGGCC 
ATGCGGCAGC TCGCCGATCC GGTGGCGGAT GATCCGGCGA TCGTGGCCGG CGAGAGCGGA 
GGGGTTGGTC TCGCAGGGTT GCTGAAGGCG GCTTCCGACC CGGAGATGAG GGCTGCACTG 
CGAATCGATG GACACTCGCG CATCTTCCTC GTCAACACCG AAGGTGCGAC CGACCCCGGC 
AAATATGAGG AGATCGTCGG GGCTTCGCCG GCAGCGATCG CGACGAAGAC CAGGATGTGA

Protein sequence

MFLLNNHPEY RQPLDPADAE TLGVAAANKV ERFLSFRENH AETPLVALPR LAAEIGVSAI 
HVKDEAYRLG LGSFKALGGA YAVIRLLLEE AGESLGRAVD VSELYSAEVR PVACSMTFAC 
ATDGNHGRSV AQGAQLVGAK AAIFVHAGVS KERVAAIARF GAEIIGVDGS YDDSVRESSR 
VAEANGWTVV SDTSWPGYER IPGLVMQGYV ALVRESLRQM PEPPTHVFIQ SGVGGIAAAV 
AGHLAVELGA RRPTFTVVDP ARAACIVETA RAGRPVTIAH GEPTVMAMLE CNTPSLLAWR 
ILARAADAFM TVDEDDAISA MRQLADPVAD DPAIVAGESG GVGLAGLLKA ASDPEMRAAL 
RIDGHSRIFL VNTEGATDPG KYEEIVGASP AAIATKTRM