Gene Mlg_2047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2047
Symbol
ID	4270181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2318842
End bp	2320443
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	72%
IMG OID	638126803
Product	gamma-glutamyltransferase 2
Protein accession	YP_742879
Protein GI	114321196
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0405] Gamma-glutamyltransferase
TIGRFAM ID	[TIGR00066] gamma-glutamyltranspeptidase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0649366
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.471768
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGCCA ATGACACGCC GCTGAGGGCG GCGGTGAGTG CACCCCATCA TCTGGCGGCC 
GAGGCGGGCG CCGGCGTGCT GCGGGAAGGG GGGAATGCCA TCGAGGCCAT GGTGGCCGCT 
GCCGCAGCGA TTGCGGTGGT CTATCCGCAC ATGAACGGCC TGGGGGGCGA CAGCTTCTGG 
TTGTTGCGCG AGCCGGGCAG GGCGCCCCTG GGTATCGAGG CCTGTGGCCC GGCGGCGGTC 
GGTGCGACAC CCGCCTGGTA CCGCGACCGG GGGCTGACGG TCATCCCTAG CCGCGGAGGG 
GCGGCCGCCA ACACCGTCGC CGGCACGGTG GCCGGCTGGC AGGTGGCGCT GGCGCTTAGT 
CGTTCGCAGT GGTCGGGGCG CCTGCCCCTG CACCGGCTCC TGGCGCCCGC CGTGGCGCAT 
GCGCGAGAGG GGTACCCGAT GACCCATAGC CAGGCCGAGG CCACCCGGGA CAAGCATCCG 
GAGCTGGGGC CGCAGCCGGG GTTTGATGCC CAGTACTTGC CCGGCGGGGC CTTTCCCGTC 
CCGGGCGAGA CGTTCCGCCA GCCGGAGCTG GCCAGCACCC TGGAACGCCT GGCGGCGGTC 
GGCCTGGCGG ACTTCTATTC CGGCGAGCTG GCACAGGCGC TGGGTGAGGG CCTCGCCGAG 
GCGGGCAGTC CGATACGGGC CCCGGACCTG GCGGGCTATG CCGCCCGCCG GGTGGCACCG 
CTGAACATGA GGCACAGCCT GGGCACCCTG TGGAACATGC CGCCACCCAC TCAGGGGTTG 
GCCTCGTTGA TGATCCTCGG AGTCTTTGAC CGGCTGCAGC GGCGCCACCC GGTAGCGGCG 
GAGAGCGCAG AGTGGTTGCA CGCCATGGTG GAGGCAGTCA AGCAGGCCTT CCTGGTGCGG 
GACCGCGTTG TCACCGATCC CGCCTATCTG CCGGAGGATC CAGCGCAGTG GCTGAAGCCG 
GAGGCGCTGG ACGCCTTGGC GGATCGGGTG GACTGGAGCC GCGCCCTGGC CTGGCCGCAG 
CCGGCCTCCC CGGGGGACAC CGTATGGCTG GGGGCCATCG ACGCCGAGGG TCGCTGTGTC 
AGCTTCATCC AGAGCCTGTT TCATGAGTTC GGCAGCGGGG TGGTCGTCCC CGACACCGGC 
GTGATCTGGC AGAACCGGGG CTGCAGCTTC TCGCTCGCGC CCGATGCCCT GAATGACCTC 
AAGCCGGGCC GCCGTCCCTT CCATACCCTG AACCCGGCCC TGGCGGTTCT GGATGACGGC 
CGTACCCTGG TATACGGCAC CATGGGGGGG GAGGGCCAAC CGCAGACCCA GGCGGCGGTG 
TTCACCCGGG TGGCCCTCTA CGGCCAATCA CCGGAGCAGG CGGTGGCCTC GCCGCGCTGG 
CTGTTGGGCA GGACCTGGGG GGCCGGGACG GACACGCTGA AGCTGGAAGC GGATTTCCCG 
CCGGAGTTGG TGGAAGCGCT GCGGGGCCGT GGCCACGACG TGGAGGTGGT GCCGCCCCGC 
AACAGTGCGA TGGGCCACGC CGGCCTCCTG GTGCGTGACC GGGCGGGCCA TGTCCGGGCG 
GCATCCGATC CGCGTAGCGA TGGAGGCGTG GCGGGGCTAT GA

Protein sequence

MLANDTPLRA AVSAPHHLAA EAGAGVLREG GNAIEAMVAA AAAIAVVYPH MNGLGGDSFW 
LLREPGRAPL GIEACGPAAV GATPAWYRDR GLTVIPSRGG AAANTVAGTV AGWQVALALS 
RSQWSGRLPL HRLLAPAVAH AREGYPMTHS QAEATRDKHP ELGPQPGFDA QYLPGGAFPV 
PGETFRQPEL ASTLERLAAV GLADFYSGEL AQALGEGLAE AGSPIRAPDL AGYAARRVAP 
LNMRHSLGTL WNMPPPTQGL ASLMILGVFD RLQRRHPVAA ESAEWLHAMV EAVKQAFLVR 
DRVVTDPAYL PEDPAQWLKP EALDALADRV DWSRALAWPQ PASPGDTVWL GAIDAEGRCV 
SFIQSLFHEF GSGVVVPDTG VIWQNRGCSF SLAPDALNDL KPGRRPFHTL NPALAVLDDG 
RTLVYGTMGG EGQPQTQAAV FTRVALYGQS PEQAVASPRW LLGRTWGAGT DTLKLEADFP 
PELVEALRGR GHDVEVVPPR NSAMGHAGLL VRDRAGHVRA ASDPRSDGGV AGL