Gene Mlg_1866 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1866
Symbol
ID	4268084
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2127165
End bp	2128355
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	71%
IMG OID	638126622
Product	succinyldiaminopimelate transaminase
Protein accession	YP_742700
Protein GI	114321017
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID	[TIGR03538] succinyldiaminopimelate transaminase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.402909
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAATC CCGACCTGGA CCGCCTGCAG CCCTACCCCT TTCAGCGCCT GGCCGCCCTG 
CGCGAAGGCG TGCAGCCGCC CGCCGATCGC GACATGATCA GCCTGGCCAT GGGCGAACCG 
CGCCACCCGG CGCCGGGGTT CGTGGCCGAG GCCCTGATCG AACACACCCA CGGACTCGCC 
CGCTACCCGG CCACCCGGGG CGACACCGCC CTGCGCGAGG CCATCTGCAG CTGGCTCAGC 
AGCCGCTTCC AGGTGCCGGC CGGCTGGCTC GACCCGGAAC GCCACGCCCT GCCGGTCAAC 
GGCACCCGCG AGGCGCTGTT CGCCTTTGCC CAGGCCATGG TGGACCGCGG GCGCCCTGGC 
GCCCGGGTAC TCATGCCCAA CCCCTTTTAT CAGATCTACG AGGGGGCAGC GCTGCTGGCC 
GGTGCCGAGC CGCGCTATCT GGACGCCACG CCGGGCGGCC AGCCCGATTT CGATGCCGTG 
CCCGCCGCGG CCTGGCGCGA CTGCCAGCTC CTCTACATCT GCACCCCGGG CAACCCCACG 
GGGGCGGTGC TGGACAACGC GCAGCTGCAA CGGTTGATCC GGCTGGCCGA CGAGCACGAT 
TTCATCATCG CCGCCGACGA GTGCTACTCG GAGATCTATC CCGACGAGGC CAACCCGCCA 
CCGGGCCTGC TGCAGGCCTG TGCGGCGATG GGGCGCAGCG GCTTTGAGCG CTGCGTGGTC 
TTCCACAGCC TGTCCAAGCG CTCGAACCTG CCCGGGCTGC GCTCCGGCTT CGTGGCCGGC 
GATGCCGAGC TGCTGGCGGG CTTCCTGCTC TACCGCACCT ATCACGGCTG CGCCATGCCC 
CCGGCCACCC AGGCCGCCAG TATCGCCGCC TGGTCGGATG AGGCCCATGT GCGGGAGAAC 
CGCGCCCTGT ACCGGCAGAA GTTCGACGCG GTGCTGGACA TCCTGGGTAA GCCGCTGGGC 
CTGGAACGCC CGCAAGCGGG GTTCTATCTC TGGCCGGAGG TGCCGGAACG GGATACGGAT 
TTCACCCTGG GGTTATGGCG CGAGGAGCAC GTGGCGGTAC TCCCTGGCAG TTTTCTCGCC 
CGTGACGGGG GCACCGGCAA CCCGGGGGCG CGGCGGGTGC GCATGGCGCT GGTGGCCGAG 
CCCGAGGCCT GTGTAGTGGC GGCGCAGCGT ATCCGCCGCT ACCTGCAATA G

Protein sequence

MSNPDLDRLQ PYPFQRLAAL REGVQPPADR DMISLAMGEP RHPAPGFVAE ALIEHTHGLA 
RYPATRGDTA LREAICSWLS SRFQVPAGWL DPERHALPVN GTREALFAFA QAMVDRGRPG 
ARVLMPNPFY QIYEGAALLA GAEPRYLDAT PGGQPDFDAV PAAAWRDCQL LYICTPGNPT 
GAVLDNAQLQ RLIRLADEHD FIIAADECYS EIYPDEANPP PGLLQACAAM GRSGFERCVV 
FHSLSKRSNL PGLRSGFVAG DAELLAGFLL YRTYHGCAMP PATQAASIAA WSDEAHVREN 
RALYRQKFDA VLDILGKPLG LERPQAGFYL WPEVPERDTD FTLGLWREEH VAVLPGSFLA 
RDGGTGNPGA RRVRMALVAE PEACVVAAQR IRRYLQ