Gene EcSMS35_4514 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4514
Symbol	alr
ID	6147339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4613349
End bp	4614428
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	56%
IMG OID	641619330
Product	alanine racemase
Protein accession	YP_001746442
Protein GI	170680683
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0787] Alanine racemase
TIGRFAM ID	[TIGR00492] alanine racemase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGCGG CAACTGTTGT GATTAACCGC CGCGCTCTGC GACACAACCT GCAACGTCTT 
CGTGAACTGG CACCTGCCAG TAAAATGGTT GCGGTGGTGA AAGCGAACGC TTATGGTCAC 
GGTCTTCTTG AGACCGCGCG AACGCTCCCC GATGCTGACG CCTTTGGCGT AGCCCGTCTC 
GAAGAAGCTC TGCGACTGCG TGCGGGGGGA ATCACCAAAC CTGTACTGTT ACTCGAAGGC 
TTTTTTGATG CCAGAGATCT GCCGACGATT TCTGCGCAAC ATTTTCATAC CGCCGTGCAT 
AACGAAGAAC AGCTGGCTGC GCTGGAAGAG GCCAGCCTGG ACGAGCCGGT TACCGTCTGG 
ATGAAACTCG ATACCGGTAT GCACCGTCTG GGCGTAAGGC CGGAACAGGC TGAGGCGTTT 
TATCATCGCC TGACCCAGTG TAAAAACGTT CGTCAGCCGG TGAATATCGT CAGCCATTTT 
GCGCGCGCGG ATGAACCAAA ATGCGGCGCA ACCGAGAAAC AACTCGCTAT CTTTAATACC 
TTTTGCGAAG GCAAACCAGG TCAACGTTCC ATTGCCGCAT CGGGTGGCAT TCTGCTGTGG 
CCACAGTCGC ATTTTGACTG GGTGCGTCCG GGCATCATTC TTTACGGCGT CTCGCCGCTG 
GAAGATCGTT CCACCGGTGC CGATTTTGGC TGTCAGCCAG TGATGTCACT AACCTCCAGC 
CTGATTGCCG TGCGTGAGCA CAAAGCCGGA GAGCCTGTCG GTTATGGTGG AACCTGGGTA 
AGCGAACGTG ATACCCGCCT GGGCGTAGTC GCGATGGGTT ATGGCGATGG TTATCCGCGC 
GCCGCGCCGT CCGGTACGCC AGTGCTGGTG AACGGTCGCG AAGTGCCGAT TGTCGGGCGA 
GTCGCGATGG ATATGATCTG CGTAGACTTA GGTCCACAGG CGCAGGATAA AGCCGGGGAC 
CCGGTCATTT TATGGGGCGA AGGTTTGCCC GTAGAACGTA TCGCTGAAAT GACGAAAGTA 
AGCGCTTACG AACTTATCAC GCGCCTGACT TCAAGGGTCG CGATGAAATA CGTGGATTAA

Protein sequence

MQAATVVINR RALRHNLQRL RELAPASKMV AVVKANAYGH GLLETARTLP DADAFGVARL 
EEALRLRAGG ITKPVLLLEG FFDARDLPTI SAQHFHTAVH NEEQLAALEE ASLDEPVTVW 
MKLDTGMHRL GVRPEQAEAF YHRLTQCKNV RQPVNIVSHF ARADEPKCGA TEKQLAIFNT 
FCEGKPGQRS IAASGGILLW PQSHFDWVRP GIILYGVSPL EDRSTGADFG CQPVMSLTSS 
LIAVREHKAG EPVGYGGTWV SERDTRLGVV AMGYGDGYPR AAPSGTPVLV NGREVPIVGR 
VAMDMICVDL GPQAQDKAGD PVILWGEGLP VERIAEMTKV SAYELITRLT SRVAMKYVD