Gene Mlg_2554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2554
Symbol
ID	4270942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2897032
End bp	2898348
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	69%
IMG OID	638127313
Product	aminotransferase
Protein accession	YP_743384
Protein GI	114321701
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0255336
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.0169818
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGCAAT ACGCTAACCA CCCCGGGCGT CGCAACCACG CCCCGGAGAT CCACCTTAAT 
CTCAACGTCC GCGGGCTGGG CCAGTCCGCC ACCCTCGTCA TCAACGAGCG CAGCGCGGCC 
CTGGCCGCGC AGGGGCGCCA CGTCTACCGC TTCGGTCTCG GCCAGTCCCC CTTCCCGGTC 
CCGGGGCCGG TGGAGGCCGA GCTCAAGGCC AATGCCCACC AGAAGGACTA CCTGCCGGTG 
GAGGGCCTGC GCAACCTGCG CGAGGCGGTG GCCGAGTACC ACCGGCGCAG CCAGGGCGTG 
GAGCTGTCGG CCGAGGATGT GCTGATCGGT CCGGGCTCCA AGGAGCTGAT GTTCATCCTG 
CAGTTGGTCT ACTACGGCGA CCTGGTCATT CCCACCCCCA GTTGGGTCTC CTACGCCCCC 
CAGGCCCACA TCATCGGCCG GCAGATCCGC TGGGTGCAGA CCCGCTACGA GAACGACTGG 
CGCCTGCTGC CCGAGGAGTT GGAGAAGCTC TGTGCGGAGG ATCCCTCCCG GCCCCGCATC 
CTGATCCTCA ACTACCCGAA CAACCCCACC GGCGAGAGCT ATACCGCGGA CGAGCTGCGG 
GGGCTGGCCC GGGTCGCCCG CAAGTACCGG GTGGTCCTGC TCTCGGACGA GATCTACAGC 
GAGCTGCACC ACCGGGGCCA GCATGTCTCG GTGGCGCGCT TCTACCCGGA GGGCACCATC 
ATCAGCAGCG GGTTGAGCAA GTGGTGCGGG GCGGGGGGGT GGCGGCTGGG TACCTTCGCC 
TTCCCCCGCG GGCTGCACTG GTTGCTGGAG GCCATGGCGG TGGTGGCCAG CGAGACCTAC 
ACCTCCACCA GCTCTCCGAT CCAGTATGCG GCGGTGCGCG CCTTCCAGGG CGGCCTGGAG 
ATCGAACAAT ACCTGCAGCA GTCCCGGCGC GTGTTGCAGG CACTGGGCCG GTACTGCTGG 
CGGCGCCTCG ATCAGGCGGG CCTGTCCACG CCCCGTCCGG TTGGCGGGTT CTACCTGTTC 
CCCGACTTCA GCCCACAGCG CGAGCGGCTG GTGGCGCGCG GCATCCACAC CGCGCCGGCG 
CTCTGCAACC GGCTGCTGCA GGAGACCGGC GTGGCGCTGC TACCGGGCAG TGCGTTCGGG 
CGGCCCGAGG CGGAACTGTC GGCCCGGCTC GCCTATGTGG ACTTCGACGG CGCCCGGGTG 
CTCACTGCGG CGTCGGCGGA ACCGGCGGGC AAGCTCTCCG AGGAGTTCCT CGAACATTGC 
TGTCCCAACG TCGTGGCCGG GATGGAGCGC ATCGTGGATT GGGTGCAGCG CGCCTAG

Protein sequence

MPQYANHPGR RNHAPEIHLN LNVRGLGQSA TLVINERSAA LAAQGRHVYR FGLGQSPFPV 
PGPVEAELKA NAHQKDYLPV EGLRNLREAV AEYHRRSQGV ELSAEDVLIG PGSKELMFIL 
QLVYYGDLVI PTPSWVSYAP QAHIIGRQIR WVQTRYENDW RLLPEELEKL CAEDPSRPRI 
LILNYPNNPT GESYTADELR GLARVARKYR VVLLSDEIYS ELHHRGQHVS VARFYPEGTI 
ISSGLSKWCG AGGWRLGTFA FPRGLHWLLE AMAVVASETY TSTSSPIQYA AVRAFQGGLE 
IEQYLQQSRR VLQALGRYCW RRLDQAGLST PRPVGGFYLF PDFSPQRERL VARGIHTAPA 
LCNRLLQETG VALLPGSAFG RPEAELSARL AYVDFDGARV LTAASAEPAG KLSEEFLEHC 
CPNVVAGMER IVDWVQRA