Gene Mlg_0235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0235
Symbol
ID	4270862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	267857
End bp	269518
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	67%
IMG OID	638124959
Product	ferredoxin-dependent glutamate synthase
Protein accession	YP_741080
Protein GI	114319397
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0069] Glutamate synthase domain 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.948942
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAAGA CGCTATGGCC AGTGCCGGGG CGGTATGTCC CGTACCTGAT CTGTATCGCG 
GCCTTCGTGA TCTCGCTGCT GTGCCTGCAG GTCAGCGCCA CCTGGGGGTG GGGCGTGGCC 
CTCTTCGGCG GCCTCTCATT GCTGGGCACC TGGGATCTGC TCCAGCCCCG CCGCACCATC 
AGCCGCAACT ACCCGGTCAT CGCTCACTTG CGCTACTGCC TGGAAGGTAT CGGCCCGGAA 
ATCCGGCAGT ACTTCATCGA ATCGGACACC GACGAGCGAC CCTTCTCCCG GGAACAGCGC 
TCAGTGGTCT ACCAGCGGGC CAAGAACCAA CTGGACAAGC GCCCCTTTGG CTCCCTGCTG 
AACCTCTACG GCGACGGTTA CGAATGGGTC AGCCATTCCG TCCAACCGGT AGCCGTTGAT 
CCCTCGGCCT ACCGAGTGGA GATCGGCGGT CGCTGCCAAC AACCCTATTC GGCCAGCGTC 
TTCAACATCT CTGCCATGAG CTTCGGCGCC CTTTCCGCCA ATGCCATCCT GGCCCTCAAC 
AAGGGCGCGC GGCTGGGCGG CTTCTATCAG GACACCGGCG AGGGAGGCAT CTCCCGGTAC 
CACCTGGAAC ACGGCGGAGA CCTGGTCTGG GAGATCGGTT CCGGTTATTT CGGCTGCCGG 
ACCCCGGATG GCAGCTTCAG CCCCGAACGC TTCGCGGAGA CGGCCGGCCT GGACAGCGTC 
CGCATGATTG AGATCAAGCT CTCCCAGGGC GCGAAACCCG GGCATGGCGG CATCCTGCCC 
GCCGCCAAGG TGAGTCCGGA AATCGCTGCG GCCCGCGGCG TGCCCGAGGG TGAGGACGTG 
ATCTCCCCGC CACGCCATTC CGCCTTTTCC ACGCCCCGGG AGCTGATGCA GTTCATCGGG 
CAACTGCGTG AACTCTCCGG CGGCAAGCCG GTGGGCTTCA AGCTGGCCAT CGGCCACCCC 
TGGGAGTGGT TCGCCCTGGC CAAGGCCATG CAGGCAAGCG ACGAGCGACC GGATTTCATT 
GTCGTGGACG GCGGTGAGGG AGGCACCGGT GCCGCGCCCC TGGAGTCGAT CAACCGACTG 
GGCATGCCGC TGGACGAGGC CCTGCTGCTG GTCCACAACA CCCTGGTGGG CACCGGCCTG 
CGTGACCACA TCCGCCTGGG GGCCGCCGGC AAACTGACCA GCGGCTTCAA GGTCGCGCGC 
ACCCTGGCGC TGGGCGCGGA CTGGTGCAAT GCCGCCCGTG GCTTCATGTT CGCGCTCGGC 
TGCATCCAGT CCCTGAGCTG TCATACCGAC CGCTGCCCCA GCGGGGTGGC CACCCAGGAC 
CGGCGGCGCA GCCGCGGCTT GCACGTGGGC GACAAGGCGC TGCGAGTACG CAACTTCCAC 
GCAGGGACCG TGGAGGCGCT CGGCAGCCTG CTGGCCGCCG CTGGCCTGAG CCACCTCGAC 
CAGCTCACAC CCGACCATAT CTACCGGCGC CTGTCCGGCA CCGAGGTCCG GAGCTTCGCG 
GAACTCTACC CCTTCGTTGA AAAGAACGCG CTGCTGTCCG GCGCCCCCGC CTACCCGGCA 
GTATTCCGTG AGTACTGGCC CAGGGCGTCG CCGGACACCT TTCACCCAGT CACCCCCAAA 
CACCACCCCA GTGAGGAGGC CGCCATGAAA GGAACCGCGT GA

Protein sequence

MSKTLWPVPG RYVPYLICIA AFVISLLCLQ VSATWGWGVA LFGGLSLLGT WDLLQPRRTI 
SRNYPVIAHL RYCLEGIGPE IRQYFIESDT DERPFSREQR SVVYQRAKNQ LDKRPFGSLL 
NLYGDGYEWV SHSVQPVAVD PSAYRVEIGG RCQQPYSASV FNISAMSFGA LSANAILALN 
KGARLGGFYQ DTGEGGISRY HLEHGGDLVW EIGSGYFGCR TPDGSFSPER FAETAGLDSV 
RMIEIKLSQG AKPGHGGILP AAKVSPEIAA ARGVPEGEDV ISPPRHSAFS TPRELMQFIG 
QLRELSGGKP VGFKLAIGHP WEWFALAKAM QASDERPDFI VVDGGEGGTG AAPLESINRL 
GMPLDEALLL VHNTLVGTGL RDHIRLGAAG KLTSGFKVAR TLALGADWCN AARGFMFALG 
CIQSLSCHTD RCPSGVATQD RRRSRGLHVG DKALRVRNFH AGTVEALGSL LAAAGLSHLD 
QLTPDHIYRR LSGTEVRSFA ELYPFVEKNA LLSGAPAYPA VFREYWPRAS PDTFHPVTPK 
HHPSEEAAMK GTA