Gene Mlg_1087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1087
Symbol
ID	4270032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1266553
End bp	1267731
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	64%
IMG OID	638125839
Product	aminotransferase
Protein accession	YP_741929
Protein GI	114320246
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGATATCA AACTGGCGAA TCGGGTTCAA CGTGTGAAGC CCTCTCCCAC TCTGGCGGTG 
ACCGCCAAGG CGGCGGAACT GCGCGCCGCG GGCAAGGACA TCATCGGCCT GGGGGCCGGC 
GAGCCTGATT TCGACACGCC TGAGCATATC AGAGACGCAG CCATAACGGC GATCAACGAG 
GGTGAGACCC GCTACACCCC CGTCGACGGC ACTCCGGCGC TGAAGAAGGC CGTGATCAAT 
AAGTTCAAGC GCGAGAACGG CCTGGACTAC GATGGCAAGC AGGTGCTGGT CTCCTCCGGC 
GCCAAGCACT CGCTGTACAA CCTGATGTGC GCCCTGCTCA ACGAGGGCGA CGAGGTGATC 
ATCCCGGCGC CCTACTGGGT GTCCTACCCG GACATGGCCA AGCTGGCCGA CGCCGAGCCG 
GTGATCATCG AGGCCGGTCA GGAGCAGGGG TTCAAGATCA CCCCCGAGCA GCTGGAGGGC 
GCGATCACTG ACCGCACCCG GCTGTTCGTG ATCAACAGTC CGTCCAATCC CACCGGTTCC 
GCCTACAGCA AGGCCGAGCT GGCCGCGCTG GGCGAGGTGT TGAAGAAGCA TCCGCAGATC 
GTGGTGGTCA CCGACGATAT CTACGAGCAC ATCCTGTTCG AGGGTGAGTT CGTCAACATC 
GTCAACGCCT GCCCGGAGCT GAAGGACCGC ACCGTGGTGG TCAACGGGGT GTCCAAGGCC 
TACGCCATGA CCGGCTGGCG GGTCGGTTAT GCCGCGGGCC CCGAGGCGCT GATCGGCGCC 
ATGAAGAAGA TCCAGTCCCA ATCGACCTCC AACCCGGCCT CGGTCTCCCA GGCCGCGTCG 
GTGGCGGCGC TGGACGGTGA TCAGGGCTGC ATCCCGCCCA TGCTGGAGCA ATTTAAGAAG 
CGCCACGACT TCGTGGTGGA CGCCCTGAAC AAGATCGACG GCGTCGAGTG CCGCCCCTGC 
GAGGGCACCT TCTACTGCTT CCCCAATATG CAGGGTGCCA TCGACAAGCT GGACGGCGTC 
GGCAATGACG TGGAACTGGC CGGGTTCCTG CTGGAGCAGG GTGTGGCCCT GGTGCCCGGC 
TCCGCTTTCG GTCTCGAGGG CTATGCCCGG ATCTCCTTCG CCACCAGCAT GGAGAACCTG 
GAGAAGGCCA TGGAGCGGAT CGCCAAGGCG CTGGGCTGA

Protein sequence

MDIKLANRVQ RVKPSPTLAV TAKAAELRAA GKDIIGLGAG EPDFDTPEHI RDAAITAINE 
GETRYTPVDG TPALKKAVIN KFKRENGLDY DGKQVLVSSG AKHSLYNLMC ALLNEGDEVI 
IPAPYWVSYP DMAKLADAEP VIIEAGQEQG FKITPEQLEG AITDRTRLFV INSPSNPTGS 
AYSKAELAAL GEVLKKHPQI VVVTDDIYEH ILFEGEFVNI VNACPELKDR TVVVNGVSKA 
YAMTGWRVGY AAGPEALIGA MKKIQSQSTS NPASVSQAAS VAALDGDQGC IPPMLEQFKK 
RHDFVVDALN KIDGVECRPC EGTFYCFPNM QGAIDKLDGV GNDVELAGFL LEQGVALVPG 
SAFGLEGYAR ISFATSMENL EKAMERIAKA LG