Gene Mlg_1413 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1413
Symbol
ID	4270411
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1619632
End bp	1620777
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	68%
IMG OID	638126169
Product	aminotransferase, class V
Protein accession	YP_742252
Protein GI	114320569
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.354567
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.630226
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGTGGC AGGCAGAGTT CCCGCAGGAT GATGGTATCG CCTATCTCAA TCACGCCGGG 
GTGAGCCCCT GGCCGGCGTG CACCCGTGAC GCGGTCGCCG AGTTCGCCGC CGAGAACGTC 
CGCCAGGGTG CGGCCGCCTA CCCGCGATGG CTGGAAGCGG AACATCGACT GAAGAACCGG 
TTGGCTGAGC TGATCAACGC GCCCTCCTCC GATACCATTG CGCTGGTGAA AAACACCTCC 
GAGGGGCTGT CCATGATCGC CTGGGGCCTG GACTGGGCCC CGGGGGACGA GGTGGTGATC 
AACCGCCATG AATTCCCGTC CAATCGTATC GTGTGGGAGT CGCTGGCGCG CCTGGGTGTG 
CGGGTGCGCG ATGTTTCGTG GACGGTGGGT GACCCTGATC CCGAGTCCCG CCTGATCGAG 
GCCATGGGGC CAAAGACCCG CCTACTGGCG GTGAGCACGG TGCAGTACGC CAGCGGTGAG 
CGGATGGACA TCGCGCGCCT GGTCACCGCC TGCCGGGAGC GGGGGGTGCT CTGCTGCGTC 
GACGGGATCC AGAGCCTGGG GGCGCTGCCC CTGGATGTGG CGGCGCTGGC GCCGGATTTT 
GTGGTGGCGG ATGGGCACAA GTGGCTGCTG GGCCCGGAGG GGTTGGGTTT TATGTACGTC 
CGCCCGGAGC TGATCGGCCA GCTCCAGCTC TATCAGTACG GCTGGCACAT GGTGGAGCAC 
GCGGGGGACT ACGACCGTAG TGACTGGGCG CCGGCCGCCA GTGCCCGTCG CTTCGAGTGC 
GGCAGCCCCA ATATGCTCGG GGTGCACGCG CTGGTGGCCA GCGTCAGCCT GCTGCTGGAG 
GTGGGGCCGG ACACGATCGC CGAGAACGTG CTCGATAACA CCCGCCACCT GATGGACTGG 
GTGGATCAAC GGCCGGAACT GGAGCTGATC ACGCCCCGGG AGGGGGGGCG CCACGCGGGC 
ATCGTCACCT TCCGGGCCCC GGGGGCGGAT GCCCGTGCAC TGTGGAAACG GCTCTCATCG 
GCGGGTGTGG TCGCCGCCCA CCGCATGGGC GGCGTGCGTT TCTCGCCCCA TTTTTACACC 
GAGCCAACCC GCCTGGAGTA CGCCACCGAG CAACTCCTCG CCGCCCTGCC CCACTGCCGG 
GCTTGA

Protein sequence

MWWQAEFPQD DGIAYLNHAG VSPWPACTRD AVAEFAAENV RQGAAAYPRW LEAEHRLKNR 
LAELINAPSS DTIALVKNTS EGLSMIAWGL DWAPGDEVVI NRHEFPSNRI VWESLARLGV 
RVRDVSWTVG DPDPESRLIE AMGPKTRLLA VSTVQYASGE RMDIARLVTA CRERGVLCCV 
DGIQSLGALP LDVAALAPDF VVADGHKWLL GPEGLGFMYV RPELIGQLQL YQYGWHMVEH 
AGDYDRSDWA PAASARRFEC GSPNMLGVHA LVASVSLLLE VGPDTIAENV LDNTRHLMDW 
VDQRPELELI TPREGGRHAG IVTFRAPGAD ARALWKRLSS AGVVAAHRMG GVRFSPHFYT 
EPTRLEYATE QLLAALPHCR A