Gene Mlg_1661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1661
Symbol
ID	4270262
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1900257
End bp	1902203
Gene Length	1947 bp
Protein Length	648 aa
Translation table	11
GC content	67%
IMG OID	638126419
Product	putative glutamate synthase (NADPH) small subunit
Protein accession	YP_742497
Protein GI	114320814
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0493] NADPH-dependent glutamate synthase beta chain and related oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.950377
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCA CCACCAACGA GATGCAGTCG CTGACCCTGC GCCGATTCAA GGAGGGCGAC 
CATCAGCCCA AGGACTGGCA GGAGCAGATC TTCCAGGCCG GCTGGTCGCA CAAGTGCCCC 
ACCTATGTGC ACCGGACACC GCCGTGCCAG GGCAGTTGCC CGGCGGGCGA GGATATCCGG 
GGCTGGTTGC AGATTGCCCG CGGACTGGAC AAGCCGACGG CGGACGAACC CTGGCAGGCC 
TATGCCTTCC GTCGCCTCAC CGAGGCGAAC CCCTTTCCTG CGGTAATGGG CCGGGTCTGC 
CCCGCCCCCT GCGAACAGGG GTGCAACCGT AACGCGGTGG AGGATCACGT TGGCATCAAC 
GCCGTGGAAC ATAAGATTGG CGACTGGGCG CGGGAAAATG ATCTGAAATT CGATGCCCCG 
GGCGAGCCCA CCGGCCGCCA CGTGGCGATC ATCGGCAGCG GCCCGGCCGG TATGGCCGCG 
GCTTACCAAC TGCGCAAACG GGGCCATGCC TGCACCCTGT TCGAGGCCCA GGAGGAACTG 
GGCGGCATGA TGCGCTACGG CATCCCGGGC TACCGCGTCC CGCGGCAGGT TCTCGATGCC 
GAGATCCAGC GCATCCTCGA CCTGGGCGTG GAGGTCCGCA CCGGGGTCTG GGTCGGCCGG 
GACATCACCA TCGAACAGCT CGACAACGAC TACGACGCCG TTCTCTGGGC GGTCGGCACC 
CACAAAGGGC GCGACCTGCC GGTGGAGGGC TTCGAGGCGG CGCCCAACTG CCTCACCGGT 
GTGGACTTCC TGCGGGCCTT CAACGAGGGC CGGCTGCACG CGGTGAGCGA CCGGGTCATC 
GTGATCGGCG GCGGTGACAC CTCCATCGAC GTGGCCTCGG TCGCCCGCCG GCTTGGCTAC 
AGCTCGGAGC TCGGCGACAA CCAGGGCGTG GAGCACGTGG TGATGGGCTA TACCGCCCAC 
GATGCCGCCA GCCTGGCGGT GCGGGAAGGG GCCAAGGTCA CCCTCACCTC CCTGTTCCCG 
CGCGAGGAGA TGACTGCCAC CGACCAAGAG GTGGAGGACG CCCTGCGCGA GGGGGTGGAC 
ATCAAGGCCG GCGTCATGCC GGTGGCCGTA ATCACCGATG ACGAGGGCAG GGCCACCGCC 
GTGCGCTTCG CCGAATGCCG GATGGAGAAA AACCGCCCCG TCCCCCTGGA AGGCACGGAG 
TTCGAGGTCG AGACCGACCT GGTGATCTCG GCCATCGGCC AGATGGGCAA CCTGGAGGGG 
CTGGAGGCGC TGGACAACGG CAACGGCTTC ATGGACTGCG ACCCCCACTT CCAGGTCAAG 
GGTCGACCGG GGCACTTCGT GGCCGGGGAC ATCATCCGCC CGCACCTGCT GACCACCGCC 
ATCGGCCAGG CCCGCAGCGC GGTCGCCAGC ATGGATCACT ACTTCCAGAC CGGCGAACCC 
GCCAAGTTCC CCAAGATCAA CGTCCTGCAC TTCAACCTGC TGCAGGCGAT GCGCAAGGCG 
GGCCAGGAGC CGACGCCCTA CGAGCCGCAG CCGGTGCGCG GCACCGCCGA CTCGGCTTTC 
GCCGTCCACA ACTACGAGGA CCGCTCCAAG GTCGAGATCA TCAAACACGA CCAGCTCTTC 
CTCGGCCATT TCAAGCCGAC ACCACGCCAC CAGCGCCAGC ATCGCGAGAT CAGTGAAGAC 
TCGGTGATCG GTGATTTCGA TGAGCGGCTC CATCCGTTGT CCGATGAGGA GGCCGTCGCT 
GAGGCCGAGC GCTGCATGAG TTGCGGCCTC TGCTTCGAGT GCGACAACTG CCTGATCTAC 
TGCCCCCAGG ACGCGGTCGA GCGGGTGCCG AAAAAGGAAC GCGCGACCGG TCGCTACGTG 
CAGACCGATT ACACCCGCTG CATCGGCTGT CATATCTGCC GCGATGTCTG CCCCACCGGT 
TACATCGAGA TGGGGCTGGG GGAATAA

Protein sequence

MSTTTNEMQS LTLRRFKEGD HQPKDWQEQI FQAGWSHKCP TYVHRTPPCQ GSCPAGEDIR 
GWLQIARGLD KPTADEPWQA YAFRRLTEAN PFPAVMGRVC PAPCEQGCNR NAVEDHVGIN 
AVEHKIGDWA RENDLKFDAP GEPTGRHVAI IGSGPAGMAA AYQLRKRGHA CTLFEAQEEL 
GGMMRYGIPG YRVPRQVLDA EIQRILDLGV EVRTGVWVGR DITIEQLDND YDAVLWAVGT 
HKGRDLPVEG FEAAPNCLTG VDFLRAFNEG RLHAVSDRVI VIGGGDTSID VASVARRLGY 
SSELGDNQGV EHVVMGYTAH DAASLAVREG AKVTLTSLFP REEMTATDQE VEDALREGVD 
IKAGVMPVAV ITDDEGRATA VRFAECRMEK NRPVPLEGTE FEVETDLVIS AIGQMGNLEG 
LEALDNGNGF MDCDPHFQVK GRPGHFVAGD IIRPHLLTTA IGQARSAVAS MDHYFQTGEP 
AKFPKINVLH FNLLQAMRKA GQEPTPYEPQ PVRGTADSAF AVHNYEDRSK VEIIKHDQLF 
LGHFKPTPRH QRQHREISED SVIGDFDERL HPLSDEEAVA EAERCMSCGL CFECDNCLIY 
CPQDAVERVP KKERATGRYV QTDYTRCIGC HICRDVCPTG YIEMGLGE