Gene Athe_0474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0474
Symbol	aspA
ID	7407553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	544462
End bp	545847
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	38%
IMG OID	643714862
Product	aspartate ammonia-lyase
Protein accession	YP_002572379
Protein GI	222528497
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1027] Aspartate ammonia-lyase
TIGRFAM ID	[TIGR00839] aspartate ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.180708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAGAA TAGAAAAAGA TTTCTTGGGC AGTATTGAGC TTTCTGACCT TGAGCTTTAT 
GGAATTCACA CAAAACGCGC TTTTGCTAAT TTCAATGTTT CTGGAAAGAG CGTTGACAAA 
GATTTAATAA AATCGCTTGT CATGGTCAAA AAAGCGTGCG CAATTGCAAA TTATGAAGTT 
GGTCTTTTGG ATGAAAAAAT TAAAGATGCT ATTGTCTTTG CATGTGACGA AATTCTGGCA 
GGAAAATATG ATGACCAGTT CATTGTAGAC AGATTCCAGG GCGGTGCGGG AACATCTACA 
AATATGAATG TAAACGAAGT TATTGCAAAC GTAGCCTTAA TTCACATTGG AAGAAAACCG 
GGTGAGTATG ACATAATTCA TCCAATCAAC CATGTTAATA TGTCACAGTC AACAAACGAT 
GTGTACCCTA CAGCCTTGCG AATTGCCACT ATATGGAATG TAAGAGAACT TTCAGAAGAA 
TGTGCAGAGC TTCAAAAAAG CCTTCAGAAA AAAGAGCATG AATTTGAAGA TGTAATCAAG 
GCAGGAAGAA CACAGCTGCA GGATGCCCTG CCTGTAACAC TTGGTCAGGA GTTTGGTGCA 
TATGCCCAAG CTATCTCACG CGACAGATGG AGACTATACA AGGTTGAAGA GCGGCTAAGA 
GTGGTCAATC TTGGTGCAAC TGCTGTTGGC ACAGGAGTAA ACGCACCTTT GAAATACATT 
TTTAAGGTGA TAGAAATATT AAGAACTTTA ACCAAAATCG GCTTGGCTCG TTCAGACTAT 
CTTATGGACG CAACACAGAA CGCAGACGTT TTTGTTGAAT GCTCTGGGCT TTTGAAAGCA 
TTAGCAGTAA ATCTCTCAAA AATTGCAAAT GATCTTCGTC TTCTTTCCTC TGGCCCAAAC 
ACGGGCTTTA ATGAGATAAA CCTGCCAGCT GTTCAGGCAG GTTCAAGTAT TATGCCAGGA 
AAGGTAAATC CTGTTATACC AGAGCTTATA AACACAGTAG CTTTTCAGGT GATGGCAAAT 
GACTTTGCGA TAACTTTAGC AGCACAAGCT GGTCAGCTTG AGCTGAATGC TTTTTTACCT 
CTGATAGCAA ACAATCTTCT TGAAAGTCTT AAAATTCTCA AAAACGGTAT TAAAATTTTC 
AGGCAGCAGT GTATAGATGG TATAACAGCA AACAAAGAAA AATGTTTAGA GTATGCAAAA 
AAGACTCCTG CTATTGCAGC AAGCTTAATT GACAGGATTG GATATGACAA GGCAGCAGAA 
ATTGCAAAAA AGGCTATTCT TGAGAACAAA CAGATAATTG ATGTTGTCAA AGAGCTAAAT 
ATTATGGATG AAAAAGAAGC ACAAGAGCTT TTGAATCCTT TTGAGTTTAT AAAGTTTAAA 
GAATGA

Protein sequence

MSRIEKDFLG SIELSDLELY GIHTKRAFAN FNVSGKSVDK DLIKSLVMVK KACAIANYEV 
GLLDEKIKDA IVFACDEILA GKYDDQFIVD RFQGGAGTST NMNVNEVIAN VALIHIGRKP 
GEYDIIHPIN HVNMSQSTND VYPTALRIAT IWNVRELSEE CAELQKSLQK KEHEFEDVIK 
AGRTQLQDAL PVTLGQEFGA YAQAISRDRW RLYKVEERLR VVNLGATAVG TGVNAPLKYI 
FKVIEILRTL TKIGLARSDY LMDATQNADV FVECSGLLKA LAVNLSKIAN DLRLLSSGPN 
TGFNEINLPA VQAGSSIMPG KVNPVIPELI NTVAFQVMAN DFAITLAAQA GQLELNAFLP 
LIANNLLESL KILKNGIKIF RQQCIDGITA NKEKCLEYAK KTPAIAASLI DRIGYDKAAE 
IAKKAILENK QIIDVVKELN IMDEKEAQEL LNPFEFIKFK E