Gene Sfum_3468 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_3468
Symbol
ID	4458205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	+
Start bp	4235017
End bp	4236357
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	64%
IMG OID	639704240
Product	UDP-N-acetylmuramoylalanine--D-glutamate ligase
Protein accession	YP_847574
Protein GI	116750887
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0771] UDP-N-acetylmuramoylalanine-D-glutamate ligase
TIGRFAM ID	[TIGR01087] UDP-N-acetylmuramoylalanine--D-glutamate ligase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.694079
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0198474
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGGCA GGGCGCTGGT CGTCGGCATG GGAGTGTCCG GCCGGTCGGT GTGCGAGTTG 
CTCTTGCGCA ACGGAGTCGA GGTCGTCGCG ACGGACCTCA GGCCGCTCGA CCGGTTCGGC 
GGCACCCTGG ACGAGCTGCG TGCGAAAGGC TGCCGGTTAA GGTTGGGGGA ACATCACCCG 
GATGATTTCC TGAACGTCGA CCAGATCATT GTGAGTCCGG GAGTGCCGTC GCTGCTCGAA 
CCGCTGCGTG AAGCCCGCCT CAGGGGTATC GAGATCGTGG GCGAATTCGA ATGGGCCTGG 
CGCCAGGTGG ACGCGCCCGT GATCGCGGTC ACCGGGACCA ACGGCAAGAC GACGACCACC 
GCTCTTATCG GGGAAATGAT CAAAGCGTCC GGCACGCGCG TGTTCGTGGG GGGCAACATC 
GGGACGCCGC TGAGCCGGTG GCTGCTGGAC GGAGACCGGG TGGACTGCAT GGTGCTCGAA 
GTGAGCAGTT TTCAACTGGA CACGGCGTTC CTGTTCAGGC CCGAGGTGGG AGTCTTGCTG 
AACGTGACCG AGGACCACCT GGATCGATAT CGCGATTTTG AAGAGTACAC GGAATCCAAG 
CTCTCGATGT TTGGGCGCCA GGAGTCCACG GATGTCGCGG TGATCAACCT GGACGACCCG 
GTCTGCGGCT CGAGGCCTTT CAACGGAAAG GGCAGGCTTC TGACCTCGAG CCGGAATGAT 
CCGCGCACGC ACGCCCATGT CGAGGACGGG CGGATCGTCG TGAACGTTCC GTGGAAGCCG 
GAGTTCCGTC TCGACCTGGC GGATCTGCGG CTCAAAGGGG TCCACAACGA GGAGAACGTG 
CTCGCCGCCA TTCTTGCATG CCTGGCCATG GACGTAGTCC CCGAGGCCGT CGCGCGGGCC 
GCCGGGACCT TTGGCGGCCT GCCCCACCGT GTCGAATGGG TTCGAGCGGC CGGGGGCGTC 
GATTACTACG ACGATTCCAA GGGGACCAAC GTCGGCGCCG TCGTCAAGGC GATCGAAAAT 
TTCGATCGAC CCGTTCTCCT CTTGTTGGGG GGAAGGGACA AGCTGGGCTC CTACGCTCCC 
ATTGCCGAGC GGATGAGGAC CAGGGGCAAG GGGGTGTTCG TGTTCGGAGA ATCGGCTCCA 
CGAATCCACG CAGAACTGCG CGACAAGGTT CCCATCCGGT TGTTTCCCGA TTTGGAGGGT 
GCGTTCTCGG CCGCCGTGGA ACGGGCGCAG GCGGGAGACA TCGTGCTCCT TTCCCCGGCC 
TGTTCGTCTT TCGATCAGTA CGAGAGCTAC GCGCAGAGGG GGGACCATTT CAAGAAACTC 
GTAGCCGCCC TTCCGGGGTA G

Protein sequence

MPGRALVVGM GVSGRSVCEL LLRNGVEVVA TDLRPLDRFG GTLDELRAKG CRLRLGEHHP 
DDFLNVDQII VSPGVPSLLE PLREARLRGI EIVGEFEWAW RQVDAPVIAV TGTNGKTTTT 
ALIGEMIKAS GTRVFVGGNI GTPLSRWLLD GDRVDCMVLE VSSFQLDTAF LFRPEVGVLL 
NVTEDHLDRY RDFEEYTESK LSMFGRQEST DVAVINLDDP VCGSRPFNGK GRLLTSSRND 
PRTHAHVEDG RIVVNVPWKP EFRLDLADLR LKGVHNEENV LAAILACLAM DVVPEAVARA 
AGTFGGLPHR VEWVRAAGGV DYYDDSKGTN VGAVVKAIEN FDRPVLLLLG GRDKLGSYAP 
IAERMRTRGK GVFVFGESAP RIHAELRDKV PIRLFPDLEG AFSAAVERAQ AGDIVLLSPA 
CSSFDQYESY AQRGDHFKKL VAALPG