Gene Moth_1785 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1785
Symbol
ID	3832451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1837980
End bp	1839371
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	60%
IMG OID	637829710
Product	aminotransferase
Protein accession	YP_430629
Protein GI	83590620
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4992] Ornithine/acetylornithine aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACAGGAG AGAAAATAAT CAGCCTGGAG ACGGCCCTGC AGGCCGGCCG CCAGGAAACC 
AGGGATCTCT ACCGTCGTTA TATCAATCCT GGCCTGGCCA CGATGCTGGC CCTGCTGGAC 
TTCGACAAGG CCTTTGTCCG GGCCGAGGGA ATGGCGGTCT GGGATAAGGA CGGTAAACGC 
TACCTTGATT TCCTGGGCGG CTACGGCGCC CTGAACCTGG GCCATAACCC GCCGGAGGTG 
CTGGCGGCAG TCAAAGAGGC CATGGGCCGC CCCAACCTCC TCCAGGCTTC CCTCAATCCC 
CTGGCGGCAG CCCTGGCCCA TAACCTGGCC CAGGTTACTC CGGGCGACCT GGAGCGGGTT 
TTTTTTAGCA ACAGCGGGAC TGAAACGGTG GAGGGCGCCC TGAAACTCGC CCGGGCGTCT 
ACAGGTAGGG AGAAGATTAT TTACTGCCAG AACTCCTTTC ATGGCAAGAG TTTCGGTTCT 
TTATCGGTCA CCGGGCGCCA GAAATATCAG CGTCCCTTCG GTCCCCTGTT ACCTGGCTGT 
GAGGCCGTCC CCTATGACGA CCTGGAAGCC CTGGAGGCCA AACTCTCCCG CCGGGACGCG 
GCCGCCTTTA TCGTCGAACC CATCCAGGGC GAAGGCGGGG TTATCGTTCC CCATGACGGT 
TACCTTAAAG GGGCGCGGGA ACTCTGCGAC CGCTACGGCA GCCTGCTGAT TATCGATGAG 
ATCCAGACGG GCTTTGGCCG GACTGGTTAT CTATTTGCCT GCGAGCATGA GGGCGTGGTC 
CCGGATATTA TGTGCCTGGC CAAGTCCCTG GGCGGCGGCG TCATGCCAAT CGGCGCCTAT 
ATTGCCCGGC CGGCAGTATG GGATCGGGCT TACGGCGGTA TGGACAAAGC CCTGCTCCAC 
ACCTCCACCT TCGGCGGCAA CAGCCTGGCC ACAGCCGCCG GCCTGGCAGC CCTGCAGAGC 
ATCCTGGATC AGGACCTGGC CGGCCGGGCG GCTGCTATGG GGCGTTATTT CCTGGAGAGG 
TTACGGCAGC TAAAGGAAAA GTACGATCTA ATTAAAGACG TCCGCGGCCG CGGCCTGATC 
ATCGGCCTGG AATTTAACCA GCCGGTGGGA GGGCTGTTAG ATAAACTGAC CCGGGGCAAG 
GTTAACGAAC TGGCAGGAGA GTACTTCGGT TCCCTGGTAG CCGGCGAACT CATGAACAAG 
TACCAGGTGA TAACAGCTTA CACCCTGAAC AACCCCAACG TCATCCGCCT GGAGCCGCCC 
CTGATCGTCG GTGAGGAAGA GATTGACCAT GTAGTGAATG CCCTCGAAGC CGTGCTTCGT 
GGCCATGGTT TCCTGGGGGT AACCTTAAGC AGCACCCGGA CCGCCCTGGG TTCCCTCTTT 
AAACGTAAAT AG

Protein sequence

MTGEKIISLE TALQAGRQET RDLYRRYINP GLATMLALLD FDKAFVRAEG MAVWDKDGKR 
YLDFLGGYGA LNLGHNPPEV LAAVKEAMGR PNLLQASLNP LAAALAHNLA QVTPGDLERV 
FFSNSGTETV EGALKLARAS TGREKIIYCQ NSFHGKSFGS LSVTGRQKYQ RPFGPLLPGC 
EAVPYDDLEA LEAKLSRRDA AAFIVEPIQG EGGVIVPHDG YLKGARELCD RYGSLLIIDE 
IQTGFGRTGY LFACEHEGVV PDIMCLAKSL GGGVMPIGAY IARPAVWDRA YGGMDKALLH 
TSTFGGNSLA TAAGLAALQS ILDQDLAGRA AAMGRYFLER LRQLKEKYDL IKDVRGRGLI 
IGLEFNQPVG GLLDKLTRGK VNELAGEYFG SLVAGELMNK YQVITAYTLN NPNVIRLEPP 
LIVGEEEIDH VVNALEAVLR GHGFLGVTLS STRTALGSLF KRK