Gene Mlg_1823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1823
Symbol
ID	4268178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2082912
End bp	2084135
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	63%
IMG OID	638126579
Product	aminotransferase
Protein accession	YP_742657
Protein GI	114320974
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTGA GCGATGAGTT TCCCCGCATC AAGCGTCTGC CGCCCTATGT CTTCAATATT 
GTCAACGAGT TGAAGGCGGC GGCCCGTGCC CGCGGGGAGG ACATCGTGGA CTTCGGCATG 
GGCAACCCGG ATCAGCCCAC CCCGCAGCAC ATTGTCGACA AATTGACGGA GGTGGCCCAG 
CGCGGGGACA CCCACCGTTA CTCCATGTCC CGTGGCATCC CGCGCCTGCG TCGTGCCATT 
TGTAACTGGT ACCGCGACCG CTACGATGTG GACCTGGACC GGGAGACCGA GGCCATCGTC 
ACGATCGGCT CCAAGGAGGG TCTGGCGCAC CTGGCGCTGG CCACGCTGGC CCCGGGCGAC 
GCGGTGCTGG TCCCCAACCC GGCCTACCCC ATTCACCCCT ACGGGGTGGT GATTGCCGGG 
GCCGATATCC GGCATGTGCC CATGCTCCCC GACGGCGATT TCTTTGCCGA GATGGAGAAG 
GCCATCCGGG ACAGTTATCC CAAGCCCAAG ATGTTGATCC TTAACTTCCC GTCGAACCCC 
ACCAGTGCCT GCGTGGACCT GGAGTTCTTC GAGAAGGTGG TGGCGGTGGC GCGTCAGCAC 
AACATCTGGG TGGTCCACGA TCTGGCCTAC GCCGATATCG TGTTCGATGG CTACCGGGCG 
CCCTCCATCC TTGAAGTGCC GGGGGCGAAG GAGGTGGCCG TCGAGTCCTT CTCGCTGTCG 
AAGAGCTACA ACATGCCGGG TTGGCGCGTC GGTTTCATGT GCGGCAACCG CCATCTGATC 
GCGGCGCTGG CGCGCATGAA ATCCTACCTG GACTATGGCA CCTTCACGCC CATCCAGGTG 
GCAGCCATTG CGGCGCTGGA GGGCCCTCAG GAGTGCGTCC AGGAGATCTG TGAGATGTAC 
CGGCGGCGGC GTGACGTGCT CTGTGAAGGC CTTAATGCGG CCGGCTGGGA GGTGGAGAAA 
CCCAAGGCCA CCATGTTCGT CTGGGCCCGC ATCCCGGAGC GCTATCGCGA CATGGGCTCG 
CTGGAATTCG CCAAAAAGCT GCTGCGGGAT GCCAAAGTGG CGGTCTCGCC GGGGATCGGC 
TTCGGTGATT ACGGCGACGA GTACGTGCGC TTCGGGCTGA TTGAGAACGA GCACCGCACG 
CGTCAGGCCA TCCGCTGCAT CAAGCAAATG TTCCGTCGGG ACGGTCAGCA CGACCAACAA 
CAGGAAGGGG AGGTGAGCTC TTGA

Protein sequence

MNLSDEFPRI KRLPPYVFNI VNELKAAARA RGEDIVDFGM GNPDQPTPQH IVDKLTEVAQ 
RGDTHRYSMS RGIPRLRRAI CNWYRDRYDV DLDRETEAIV TIGSKEGLAH LALATLAPGD 
AVLVPNPAYP IHPYGVVIAG ADIRHVPMLP DGDFFAEMEK AIRDSYPKPK MLILNFPSNP 
TSACVDLEFF EKVVAVARQH NIWVVHDLAY ADIVFDGYRA PSILEVPGAK EVAVESFSLS 
KSYNMPGWRV GFMCGNRHLI AALARMKSYL DYGTFTPIQV AAIAALEGPQ ECVQEICEMY 
RRRRDVLCEG LNAAGWEVEK PKATMFVWAR IPERYRDMGS LEFAKKLLRD AKVAVSPGIG 
FGDYGDEYVR FGLIENEHRT RQAIRCIKQM FRRDGQHDQQ QEGEVSS