Gene Mlg_2531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2531
Symbol
ID	4270170
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2873183
End bp	2874649
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	68%
IMG OID	638127290
Product	UbiD family decarboxylase
Protein accession	YP_743361
Protein GI	114321678
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.853758
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATACC GCGATCTGCG CGACTTCATC AGCAAGCTGG AGGCCGACGG CGAACTGCGC 
CGGGTCGACG TCGAGGTGGA CCCGCGGCTG GAGATGACCG AGGTCTGCGA CCGCACCCTG 
CGCGCCGAAG GCCCCGCCAT CCTGTTCCAA AAGCCCAAGG GGTACAGGAT GCCCGTCCTC 
GGTAACCTCT TCGGGACGCC GCGCCGGGTG GCCCTGGGCA TGGGGGCCGA GGACGTCTCC 
GCCCTGCGCG AGATCGGCGA GCTGCTCGCC TTCCTTCGCC AGCCGGAACC CCCCAAGGGG 
CTGCGCGACG CCTGGTCGCA GTTGCCGGTC TTCCGCAAGG TGCTGGACAT GGGCCCGAAA 
AAGGTCCGCC GTGCCGCCTG CCAGGAGGTG GTGGTGGAGG GCGATGACGT GGACCTGGGC 
CGGCTGCCGG TGCAGACCTG CTGGCCGGGG GACGCCGGGC CGTTGATCAC CTGGGCGCTG 
GTGGTGACCC GCGGCCCGGA GAAGGAGCGC CAGAACCTGG GCATCTACCG CAACCAGGTG 
ATCGGCCGCA ACCGAACCAT CATGCGCTGG CTCGCCCACC GGGGCGGGGC GCTGGACTTC 
CGCGACTGGC AGCGCGAGCG GCCGGGCGAA CCCTTCCCCG TGGCCATCGC CCTCGGTGCC 
GACCCGGCCA CCATCCTGGG GGCCGTCACC CCGGTGCCCG ACAGTCTGTC CGAGTACGGC 
TTCGCCGGGC TGTTGCGCGG CAGCAAGACC GAGCTGGTCA AGTGCCTGGG CCCGGACCTG 
CAGGTGCCCG CCTCGGCGGA GATCGTCCTG GAAGGGCACA TCCACCCGGA CGACACCGCA 
CCGGAGGGGC CCTTTGGGGA CCACACCGGC TACTACAACG AGGTGGACCA CTTCCCGGTG 
TTCACCGTGG ATCGCATCAC CCACCGCCGC GACCCCATCT ACCACTCCAC CTATACCGGC 
CGGCCGCCGG ACGAGCCGGC CATCCTCGGG GTGGCGCTCA ACGAGGTCTT CGTGCCCATC 
CTGCGCAAAC AGTTCCCCGA GATCAGCGAT TTCTACCTGC CGCCGGAGGG GTGCTCCTAC 
CGCATGGCCG TGGTCACCAT GAAAAAGCAG TACCCCGGCC ACGCCAAGCG GGTGATGCTG 
GGCGTGTGGT CCTTCCTGCG CCAGTTCATG TACACCAAGT TTGTTATCGT TACCGACGAC 
GACGTGAACG CCCGCGACTG GAAGGATGTC ATCTGGGCCA TGACCACGCG CATGGACCCC 
AAGCGGGACA CCGTGATGAT CGATAACACG CCTATTGACT ACCTGGACTT TGCCTCGCCG 
GTCTCCGGCC TGGGTTCCAA GATCGGCTTC GATGCCACCC ACAAGTGGCC CGGCGAGACC 
GACCGCGAGT GGGGGCGGCC TATTGTCATG GATGACGAGA CCCGGGCGCG GGTCGATGCG 
CTCTGGCCTA AGCTGGGATT AGACTGA

Protein sequence

MKYRDLRDFI SKLEADGELR RVDVEVDPRL EMTEVCDRTL RAEGPAILFQ KPKGYRMPVL 
GNLFGTPRRV ALGMGAEDVS ALREIGELLA FLRQPEPPKG LRDAWSQLPV FRKVLDMGPK 
KVRRAACQEV VVEGDDVDLG RLPVQTCWPG DAGPLITWAL VVTRGPEKER QNLGIYRNQV 
IGRNRTIMRW LAHRGGALDF RDWQRERPGE PFPVAIALGA DPATILGAVT PVPDSLSEYG 
FAGLLRGSKT ELVKCLGPDL QVPASAEIVL EGHIHPDDTA PEGPFGDHTG YYNEVDHFPV 
FTVDRITHRR DPIYHSTYTG RPPDEPAILG VALNEVFVPI LRKQFPEISD FYLPPEGCSY 
RMAVVTMKKQ YPGHAKRVML GVWSFLRQFM YTKFVIVTDD DVNARDWKDV IWAMTTRMDP 
KRDTVMIDNT PIDYLDFASP VSGLGSKIGF DATHKWPGET DREWGRPIVM DDETRARVDA 
LWPKLGLD