Gene Athe_1201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1201
Symbol
ID	7409675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1293833
End bp	1295113
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	37%
IMG OID	643715566
Product	glutamate-1-semialdehyde aminotransferase
Protein accession	YP_002573074
Protein GI	222529192
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0421801
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACTTG ACAAAAGTAA AGAAGTATTT GACAACACCA AAAGATATAT ACCAGGCGGG 
GTTAACAGTC CAGTTCGTGC ATTTAAAAAT TTGAGTATTA CACCGCCTGT CATATCAAAA 
GGAAAAGGCT GCCGTATATT TGATATTGAT GGCAATGAAT ATATTGATTT TGTTCTGTCC 
TGGGGTGCGA TGATATTAGG ACATTGTGAC CCTGATGTTG TAAATAGGAT GAAAGAAGTG 
GTGGAAGATC AAATAGCATT TGGAGCACCA ACAGAAATTG AATATAAGAT GGCAAAGCTT 
GTGTGTGAGA CAGCCCAAAT TGATATGGTT CGATTTGTTA ATTCAGGAAC AGAAGCTACA 
ATGACTGCTG TAAGGCTTGC AAAAGGTTAT ACTGGGAAGA AAAAAATAGT AAAGTTTGCA 
GGCTGTTATC ATGGTCATCA TGACATATTT CTGAAAGAAG CAGGGTCAGC AGTAGCCGAG 
CTAAGATTAA AGCGAATTGA TGAAGATATT GTACAAAATA CAATTGTGGT TGAATACAAC 
AATTTAGATT CAGTAGAAAA AGCTTTTAAA GAAAACAAAG ATGAGATAGC AGCTGTTATA 
ATCGAGCCTG TGGCAGGGAA TATGGGTGTT GTACCTGCCA AAAAAGAGTT TTTGCAAGTC 
CTAAGAGAAA TTTGCAACCT CCACGGCAGT CTTCTGATTT TTGATGAAGT AATAACCGGC 
TTTAGGCTCT CATTAAAAGG GGCAAGAGCT TTATATAATG TTGAGCCAGA CCTTGTAACT 
TTTGGCAAGA TAATTGGTGG AGGGCTTCCT TGTGGCGCAG TTGGTGGCAA GAAAGAGATT 
ATGGAATGTT TAGCACCACA GGGAAATGTC TTTCAGGCAG GTACTATGTC GGGCAATCCA 
ATTGTGATGA GTGCAGGGTA CGCTACTATC AAAAAGCTTA AAGAAAATCC TCATTTTTAT 
AGTAATTTGG AGATGTTAGC AGGAAAACTC GAAAAAGAGT TGACACAAGT CTTTTCTAAT 
TCCAATTTAA CTTTTTGCAT AAACAGGGTA GGTTCAATGC TAACAATCTT CTTTGGAGTT 
GAAAAGGTAG AAAATTTCGA GATGGCAAAG ATGAGCGATT TAGACTTGTT CAGAAGTTTT 
GCAGAATATA TGATAAAAAA CCATATTTAT GTTCCTTCCT CTCAATTTGA AGCGATGTTC 
TTATCTGTAG CACATAGCGA AAATGATGTA GAAAAATTCG TTGAAATTGC TGAGGAATTT 
TGCTCTTCAA AAAGGAAATG A

Protein sequence

MRLDKSKEVF DNTKRYIPGG VNSPVRAFKN LSITPPVISK GKGCRIFDID GNEYIDFVLS 
WGAMILGHCD PDVVNRMKEV VEDQIAFGAP TEIEYKMAKL VCETAQIDMV RFVNSGTEAT 
MTAVRLAKGY TGKKKIVKFA GCYHGHHDIF LKEAGSAVAE LRLKRIDEDI VQNTIVVEYN 
NLDSVEKAFK ENKDEIAAVI IEPVAGNMGV VPAKKEFLQV LREICNLHGS LLIFDEVITG 
FRLSLKGARA LYNVEPDLVT FGKIIGGGLP CGAVGGKKEI MECLAPQGNV FQAGTMSGNP 
IVMSAGYATI KKLKENPHFY SNLEMLAGKL EKELTQVFSN SNLTFCINRV GSMLTIFFGV 
EKVENFEMAK MSDLDLFRSF AEYMIKNHIY VPSSQFEAMF LSVAHSENDV EKFVEIAEEF 
CSSKRK