Gene Moth_1293 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1293
Symbol
ID	3831556
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1333000
End bp	1334106
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	57%
IMG OID	637829230
Product	glutamate synthase (NADPH) GltB1 subunit
Protein accession	YP_430150
Protein GI	83590141
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0067] Glutamate synthase domain 1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00303282
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTCAGGG AGGGAGATTA CCGGATACCT TCGGGCTGTG CCATAAGCGG CTTCATCAAC 
AAGGACGGCC GCCGGGTCAA CGGCAGTAGC ATCGTCCAGT CCATCGCCCT GATGCAAGAA 
CGTTCCAACG GCCTGGGAGG AGGTTTTGCC GCTTATGGTA TTTACCCGGA ATATAAGGAT 
TATTATGCCC TGCACCTGCT CTTTGAAGAT AAAATCAGCC GTAATCAGGT TGAAGAGCTG 
ATTAAAGATA ACTTTTACAT TGAGGCTGAA GACCGCATTC CCACCAGGCA CGTCAGGGCT 
ATCAGCAAAG CGCCCCTTCT ATGGCGCTAT TTTGTCACCC CCAGGGTGTC GAAAATAGAC 
GAATCTCAGG AGACGGAAGA AAATTTCATG ACCCAGCTGG TCATGCGGAT TAACGCCCAG 
GTCAAGGGGG CCTATGTGGT TTCCAGCGGC AAGAACATGG GTGCCTTTAA GGGAGTCGGC 
TATCCGGAGG ACATCGGCGA ATTCTTCCGC CTGGACGAGT ACCAGGCCTA CAGCTGGATT 
GCCCACGGCC GTTTCCCCAC CAATACCCCC GGATGGTGGG GCGGGGCCCA TCCCTTCACC 
CTGCTGGACT GGTCCGTGGT CCATAACGGC GAAGTCTCGT CCTATGGGGC CAACCGCCGT 
TTCCTGGAGA TGTATGATTA TAAAATAACC CTGCAGACGG ATACCGAGGT CATCGCCTAT 
GCCGTCGATC TCCTTGTGCG CCGCCATAAA CTCCCTCTGG AGCTGGCGGC CCGGGTCCTG 
GCGGCTCCCT TCTGGCAGGA AATCGACCGC CTGCCGGCCC AGGAACGCGA CCTCTATACC 
CGCCTGCGGG TGGTCTACGG CAGCCTCCTG CTGAACGGCC CCTTCTCTAT TATTGTCGGT 
TTCAGCGGCG GGATTATGGC ACTAAATGAT CGTTTAAAGC TGCGCCCCCT GGTAGCAGGT 
TCCAAGGGTA ATACCCTCTA TGTGGCCAGC GAAGAAGCGG CCATTCGCGA AATATGCCCT 
GATGTGGAAG AGGTCTGGTA CCCGCGGGGC GGCGAGCCGG TTATCGGCCG CCTGGAGGAG 
GAAGCCCAAT GCCGACTCTC AGCCTGA

Protein sequence

MLREGDYRIP SGCAISGFIN KDGRRVNGSS IVQSIALMQE RSNGLGGGFA AYGIYPEYKD 
YYALHLLFED KISRNQVEEL IKDNFYIEAE DRIPTRHVRA ISKAPLLWRY FVTPRVSKID 
ESQETEENFM TQLVMRINAQ VKGAYVVSSG KNMGAFKGVG YPEDIGEFFR LDEYQAYSWI 
AHGRFPTNTP GWWGGAHPFT LLDWSVVHNG EVSSYGANRR FLEMYDYKIT LQTDTEVIAY 
AVDLLVRRHK LPLELAARVL AAPFWQEIDR LPAQERDLYT RLRVVYGSLL LNGPFSIIVG 
FSGGIMALND RLKLRPLVAG SKGNTLYVAS EEAAIREICP DVEEVWYPRG GEPVIGRLEE 
EAQCRLSA