Gene Mlg_1443 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1443
Symbol
ID	4269253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1647504
End bp	1648601
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	69%
IMG OID	638126199
Product	peptidyl-arginine deiminase
Protein accession	YP_742282
Protein GI	114320599
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2957] Peptidylarginine deiminase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.0971798
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATTCCAC CGCTCACCCC CTGGGCCCAA CGCCCCCGTT TGCCCGCCGA ATGGGAGCGG 
CAGGCGGCCG TGCAATTGAC TTGGCCCCAC GACCGGGACG GGCTCTGGGG CGACCAGCTC 
CCGGCTGTGG AGGGCTGCTT TGTGGCGATG GCGAGTGCTA TCGCCGCTCA CCAGCCGGTA 
CTGGTCGTCT GCCACGACGA GCGACTGCGC GAGCGTGTGG ACGTGCTGCT GGCCCGGGCC 
GGCATGGCCG CAGAGGCCCG CCGCCTGGCC GTGGCGCCAT CGAACGATAT ATGGGCGCGG 
GACCACGGGC CGATCACAGT GCTCAACGGT GACGGCCGCC CGCTTATCCA GGATTTCGCC 
TTCAACGGGT GGGGCCAGCG TTACCGCGCC GATCGAGACG ATGTGATCAC GCAGCACCTG 
GTCCAGCAGG GCGTCTTCGG TGAGTCCCGC TTCCGCCGAG TGGAGTGGGT GCTGGAGGGA 
GGCGCAATCG ATGCCGACGG CGCCGGCACC CTGTTGACCA CCACCCGGTG TCTGCTGAAC 
GACAACCGAA ACCCGGGGGC CACCCGGGCG CAGGTGGAAC AGCAATTGAT CGCCCGGCTA 
GGCGCCAGCC GCGTCCTCTG GCTGGAACGG GGCGGGTTGA CCGGGGATGA CACCGACGGC 
CATGTGGATA TGCTGGCCCG CTTCGTCGAT CCGGAGACCA TCGTCTACCA GGCCTGCGAT 
GATCCGGACG ACGCGGACTA CCCGGAGCTT CAGGCCATGC TCAGCGCCTT ACGCGGCTTC 
ACGACCCTGC GCGGTGGCGG GTACCGCCTG GTCCCCCTGC CCTGGCCGGC GATCAAGCGC 
GATGAGCAGG GGATGCGCCT GCCGGCCAGC TATGCCAACT TTTTGATCAT CAACGGGGCG 
GTGCTGGTGC CTCAGTATCA GGACCCGGCC GACGACCGGG CCCGGGCGGT GCTGGGTGAG 
CTGTTTCCCG ATCGCGAGAT CATCGGCATT CCCGCCGTGC CGCTCATTCA GCAGCACGGC 
AGCGTCCACT GTGCCACCAT GCAACTGCCG GCCGGTGTCA CCGTTGTTGC GCCGGACCCG 
GCCGGGCACG CGGCCTGA

Protein sequence

MIPPLTPWAQ RPRLPAEWER QAAVQLTWPH DRDGLWGDQL PAVEGCFVAM ASAIAAHQPV 
LVVCHDERLR ERVDVLLARA GMAAEARRLA VAPSNDIWAR DHGPITVLNG DGRPLIQDFA 
FNGWGQRYRA DRDDVITQHL VQQGVFGESR FRRVEWVLEG GAIDADGAGT LLTTTRCLLN 
DNRNPGATRA QVEQQLIARL GASRVLWLER GGLTGDDTDG HVDMLARFVD PETIVYQACD 
DPDDADYPEL QAMLSALRGF TTLRGGGYRL VPLPWPAIKR DEQGMRLPAS YANFLIINGA 
VLVPQYQDPA DDRARAVLGE LFPDREIIGI PAVPLIQQHG SVHCATMQLP AGVTVVAPDP 
AGHAA