Gene Mlg_2058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2058
Symbol
ID	4270192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2332446
End bp	2333543
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	68%
IMG OID	638126814
Product	proline racemase
Protein accession	YP_742890
Protein GI	114321207
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3938] Proline racemase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.272833
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCTA AAGCCAGCCT GCGCCAGCTT CGTCTGGTGG ATGTGGACGT GGGCGGGGAT 
GTGCACCGGG TGGTGATGGG CGGGGTGGCC CCCTGCCCGG GGCCCACGGT GCGCGACAGC 
ATGGACTATC TGGAGTCGCG CGCCGACGGC CTGCGCCGGT TGCTGATCAG CGAGCCCTTC 
GGTTACGACT CCATGTGCGT CGACCTGGTC ATGCCCGCCT GCCTGCCGGA GGCGCAGCTG 
GGCTACGTCA TCATGGAGGT CATGGGGTAC CCCTTTTACT CCGGTTCCAA CACCATCGCC 
ACCGCGGCCG CGGTGCTGGA GGCGGGCCTG GTCCCCATGG AGGAGGGCGA GCAGTCGCTC 
TGCCTGGAGG CGCCGGCGGG CCTGACCCGG GTGCGCACGC GCAATCGTGA CGGGGTCGTG 
GAGTCGGTGA CCGCGCAGGG CTCGCCGGCC TTCATCCAGG CCAGGGATGA GTCCGTGACT 
GTGCCGGGTC TGGGGACGGT GCGCTACGAC CTGGCCTGGA GCGGGGGTTA TTACATCATG 
GTGGATGCGG CCAGTCTGGG GCATCGGGTG GCGGAGGCGG AGATCAACGC CATGATCCTG 
ACTGCCGATC GCATCGTCAA CGCCGTGCAG CGTGAATTCC GTTATCAGCA CCCGGAACTG 
GGGGCCGTGG GGCTGCCCCG GTTCCTGCAT TTCATGGGCC CCGTAGAGCG ACGCGCCGAC 
GGCAGATTGT GGGCCGCCTC CGCCACCTAT GGCCATCCGG GGGTGATATG GCGCTGTCCC 
ACCGGCACCG GGACCTCGGC CCGACTCGCG CTGATGGCGG CCCGGGGGGA GATTACGCCG 
GGTGTGCCCC TGGAGACGGT CTCGCCCGCC GGCAACGCCT TCACCGGCGT GATCAACGGC 
TTCTCCAGCG TGGGCGGGCA CCAGGCGGTG GACACGGCCA TCACCGCACG ACCCTACCCC 
GTGGCGAACA TGGATATGAC CATCGATATC GACGCCCCCA TGATGCGGCC CTACCAGCTA 
CACCACATCC TAATCACCCC CGGTAATGCC CTGACCGCCG CCGGGCGCTG CGATCAGAAT 
CGCCGGTCGT CGTCCTGA

Protein sequence

MRAKASLRQL RLVDVDVGGD VHRVVMGGVA PCPGPTVRDS MDYLESRADG LRRLLISEPF 
GYDSMCVDLV MPACLPEAQL GYVIMEVMGY PFYSGSNTIA TAAAVLEAGL VPMEEGEQSL 
CLEAPAGLTR VRTRNRDGVV ESVTAQGSPA FIQARDESVT VPGLGTVRYD LAWSGGYYIM 
VDAASLGHRV AEAEINAMIL TADRIVNAVQ REFRYQHPEL GAVGLPRFLH FMGPVERRAD 
GRLWAASATY GHPGVIWRCP TGTGTSARLA LMAARGEITP GVPLETVSPA GNAFTGVING 
FSSVGGHQAV DTAITARPYP VANMDMTIDI DAPMMRPYQL HHILITPGNA LTAAGRCDQN 
RRSSS