Gene Moth_1340 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1340
Symbol
ID	3831897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1386005
End bp	1387024
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	63%
IMG OID	637829276
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_430196
Protein GI	83590187
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.728969
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.834843
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTGAAAG CCCAGATTAG CAAAGTAGTA GCCGGCCAGC ACTTGAGCGA AGCCGAGGCC 
GCAGAAGCCA TGGACATAAT CATGGCGGGC GAAGCCACCC CGGCCCAGAT TGCCGCTTTC 
CTCACCGCCC TGCGCCTTAA AGGGGAAATG GTAGACGAGA TAACCGGTTT TGCCCGCAGC 
ATGCGCCGCC GGGCTATTCC CCTTACCACT AGCCACCCGG TATTTGTGGA CACCTGTGGT 
ACCGGGGGAG ACGGCCGCCA AACCTTTAAC ATTTCCACCA CCGCGGCCTT CGTCGTGGCC 
GGCGCCGGGG TAGCAGTAGC CAAACACGGC AACCGTTCAG TTTCCAGCCG TTGCGGTAGC 
GCCGACATGC TGGAAGCCCT GGGGATCAAA GTCGACCTGC CTCCGGACGC CGTTGCCCGC 
TGCCTGGATG AAGTGGGCAT GGCCTTCCTC TTTGCTCCCG TTTTTCATGG TGCAATGAAA 
TACGCCGCCG GACCGCGGCG GGAGATCGGC ATTCGTACAG CCTTCAACCT CCTGGGGCCC 
CTGACTAACC CGGCGGGCGC TCCCTGCCAG CTGGTGGGAG TTTACGACCC GGATTTAACG 
GAAACAGTCG CGGCCGTCCT GGGGCGCCTG GGCAGCCGCC GGGCCTATGT AGTCCACGGT 
AGCGATGGAC TGGACGAAGT AACTATCACC GGACCCAGCA AGATAACCTG CCTCGATAAA 
GGCGCGATCA GGACGTATAC CTTTACCCCG GAAGATGTCG GCCTGCCACG GGCGAACCTT 
GCCGACCTGG CCGGGGGTAC AGCCACCGAC AATGCCGCCA TTGCCCGCGC CGTCCTTTCC 
GGTACCAGGG GCCCGGCCCG GGACGTCGTC CTCATTAATG CCGCCTTCGC CCTCCTGGCA 
GCCGGTGCCG CTGACACCCT CCAGCAAGCC CTGGCCCTGG CCGAATCAAG TATCGATTCC 
GGCGCCGCGG CGGCAAAACT CCAGGCTATG GTGGCCTGGG TGGAAAGCTG GGCTGCCTGA

Protein sequence

MLKAQISKVV AGQHLSEAEA AEAMDIIMAG EATPAQIAAF LTALRLKGEM VDEITGFARS 
MRRRAIPLTT SHPVFVDTCG TGGDGRQTFN ISTTAAFVVA GAGVAVAKHG NRSVSSRCGS 
ADMLEALGIK VDLPPDAVAR CLDEVGMAFL FAPVFHGAMK YAAGPRREIG IRTAFNLLGP 
LTNPAGAPCQ LVGVYDPDLT ETVAAVLGRL GSRRAYVVHG SDGLDEVTIT GPSKITCLDK 
GAIRTYTFTP EDVGLPRANL ADLAGGTATD NAAIARAVLS GTRGPARDVV LINAAFALLA 
AGAADTLQQA LALAESSIDS GAAAAKLQAM VAWVESWAA