Gene Moth_1273 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1273
Symbol	aspA
ID	3832913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1316165
End bp	1317595
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	60%
IMG OID	637829209
Product	aspartate ammonia-lyase
Protein accession	YP_430130
Protein GI	83590121
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1027] Aspartate ammonia-lyase
TIGRFAM ID	[TIGR00839] aspartate ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000429353
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTACCC GCCAGGAACA CGACCTGCTG GGCACCAGGG AAGTACCAGC TACTGCTTAT 
TATGGTATCC ATACCCTGCG GGCCGCAGAA AACTTCAACG TCAGCCGGGC CAGGGTCCAT 
CCGGAATTGA TTAAAGCCCT GGCTACTGTA AAAGAAGCCG CGGCCAGGGC TAACCTGGAC 
CTGGGTTACC TGCCGGCCGA AAAAGGCCGG GCCATCATCA CCGCCTGCCA GGAAGTGGCC 
CGGGGTGAAC TGGCCGACCA GTTTTTCCTC GACGCCTACC AGGGCGGCGC CGGTACCTCA 
ACCAATATGA ACGTCAACGA GGTAATCGCC AACCGCGCCC TGGAAATTCT GGGTCGCCCC 
AAAGGCGATT ACGCTACCAT CCATCCCATC GATCACGTTA ACCTGCATCA GTCCACTAAC 
GATGTCTACC CCACGGCCAT GCGGGTGGCG GCCATCCGCC TGTTGCTGCC CCTGGCGGAT 
GAACTGGCGA AACTCCAGGA AGCCCTCCAG GAGAAAGAGG CCGCCTTCGC CGGGGTGGTC 
AAAATCGGTC GTACCGAGCT CCAGGACGCC GTGCCGGTAA CCCTGGGGCA GGAATTCGGC 
GCTTACGCCC AGGCCATTTC CCGGGACCGC TGGCGCCTCT ATAAAGTTGA AGAGCGCCTG 
CGCCAGGTAA ACCTGGGTGG CACCGCCACC GGCACCGGCC TTAACGCCCC CCTGAAGTAC 
ATCTACCTGG TCAACGACTA CCTGCGCCGC CTTACAGGAA TAGGCCTGGC CCGGGCGGAG 
AATATGATTG ACGCCACCCA GAATATGGAC GTCTTTGTGG AGGTCTCTGG TCTGGTCAAG 
GCTGCCGCCG TTACCATGCA CAAAATAGCC TCCGACCTGC GTTTTATGGC CGCCGGCCCC 
CGGGGCGGCC CGGCGGAGAT CAATTTGCCG GAACGCCAGG CGGGATCCTC CATCATGCCC 
GGCAAAGTCA ATCCCGTCAT CCCGGAGATG GTCAGCCAGG TAGCCATGCA GGTCATGGCC 
AATGATTACT TGATCGCCAT GGCTGCCAGT CAGGGCCAGC TGGAGCTCAA TCCCTTTGCC 
CCCCTTATTG CCCATACCTT GCTGGAATCC CTGGCCATGC TGGCGGCAGC GGCCCGGATA 
TTCCGCACCG AGTGTATCAC GGGTATAACC GCCAACCCCG AGCGCTGCCA GGAACTCCTG 
GCCGTGAGCC CGGCCCTGGC TACGGCCCTG CTGCCCTATA TTGGCTACGA GAAGGCCACG 
GAAGTAGTGC GGGAAGCCGT GGTTTCCGGC CGATCAATAA AAGAAATAGT TCTAGAAGAA 
GGGTATTTGA CCTCTGACGA ACTGGAAAAC GTCTTAACCC CGGCCGCCAT GACCAAACCG 
GGAACCGTCG GAGCCGTAAA GCAGGGAATA AAGGAGAAGG GAAAAGCGTA A

Protein sequence

MSTRQEHDLL GTREVPATAY YGIHTLRAAE NFNVSRARVH PELIKALATV KEAAARANLD 
LGYLPAEKGR AIITACQEVA RGELADQFFL DAYQGGAGTS TNMNVNEVIA NRALEILGRP 
KGDYATIHPI DHVNLHQSTN DVYPTAMRVA AIRLLLPLAD ELAKLQEALQ EKEAAFAGVV 
KIGRTELQDA VPVTLGQEFG AYAQAISRDR WRLYKVEERL RQVNLGGTAT GTGLNAPLKY 
IYLVNDYLRR LTGIGLARAE NMIDATQNMD VFVEVSGLVK AAAVTMHKIA SDLRFMAAGP 
RGGPAEINLP ERQAGSSIMP GKVNPVIPEM VSQVAMQVMA NDYLIAMAAS QGQLELNPFA 
PLIAHTLLES LAMLAAAARI FRTECITGIT ANPERCQELL AVSPALATAL LPYIGYEKAT 
EVVREAVVSG RSIKEIVLEE GYLTSDELEN VLTPAAMTKP GTVGAVKQGI KEKGKA