Gene Athe_1480 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1480
Symbol
ID	7408139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1561980
End bp	1563161
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	33%
IMG OID	643715843
Product	tRNA synthetase class II (G H P and S)
Protein accession	YP_002573351
Protein GI	222529469
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3705] ATP phosphoribosyltransferase involved in histidine biosynthesis
TIGRFAM ID	[TIGR00443] ATP phosphoribosyltransferase, regulatory subunit

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAAA AGTTTGTGGA TTACTATCCT CCAGTGTCTG ATACCTTAGA AGAGGTAAGA 
GAAAGGACTA TCTTTTTATT TAAAAAATTT GGGTACAAAT TGGTTGAACC TTCAACTTTT 
GAAGATTATG AAAAGTCAAA AAACTTAAAT GGCAGCAACA CTATAAAGTT TATGGACAGC 
GATGGAAATG TAATTGCCTT GAGAAATGAA TTTACTCCAA AGGTTGCAGA GATTGCAGCT 
AAGTTTCAGA CAAAAGTTTA TCCACTCAAA TTGTGTTACT TTGGCAAGGC ATATCAGTTT 
CTTCAACAAG AAGCAGGGGA TTTGAGGGAA TTTTTTCAAG CAGGCATAGA AAACTTTCAT 
ACATCTGATA GTTTCTATAT AGACTTAGAG ATATTAGCGC TTGCGGTAGA AAGTTTACTT 
GAACTTGGAG TGAATAACTT TACAATAGAT GTTGGAGAGG TAAATTTCTT TAAAGGAATT 
GCTAAGGACT GTGAGATTGA TGAGGCTTCA TCAGAAGTGC TCTGCAAGCT TGTTGACAAG 
AAGGACTATA TAGGGATTGA AAACTTTTTG ATTCGAAAGG GCATTTCCCA AAAAGTTATA 
GATATTTTCA GAAATCTCAC AAGACTTTAT GGTAGAGAGG ACAAGATAAA AGAGGCTAAA 
AAGTTTGCAA ACAATGAGAT ATCTAAACTG GCGATTGAGA GACTAAGTGA GATATATAAT 
AATATGATAA AACTGGGTTA TCAAAATTAT ATTACTATCG ACTTTGGAAT GGTAAAACAT 
CTAAACTATT ACACAGGTAT AATATTTTCT GGTTATATAC AAGAACTTGG CTATCCTGTG 
CTAAATGGTG GTAGATACGA TAATTTGTGT GAAATATTTG GTACCAAACT ATACGCCATT 
GGATTTGCAA TTGGTTTAGA CAGAATTTTA GAGTGGAAAC TAAAAAATAT TCCAAGGAAT 
GATAAATTTT ACGATAGCCT TGTTTTTTAT AAGGAAGGGC ACTTTAAAAT GGCATTAAAA 
CTGCTTCTTA AGACAGACAA TGAAAAACAG AAGATTTACT TTTATACAGT ACCGGCAAAA 
ATAGAAGAAG CCTTTCTTAT TAGCAAAGCT ATGAAGGTTG AGAAATTCAT GTATATAGAT 
GAAGAAGGTG TAAAAACATA TGTTTTGGAG GATTTAGAAT GA

Protein sequence

MSKKFVDYYP PVSDTLEEVR ERTIFLFKKF GYKLVEPSTF EDYEKSKNLN GSNTIKFMDS 
DGNVIALRNE FTPKVAEIAA KFQTKVYPLK LCYFGKAYQF LQQEAGDLRE FFQAGIENFH 
TSDSFYIDLE ILALAVESLL ELGVNNFTID VGEVNFFKGI AKDCEIDEAS SEVLCKLVDK 
KDYIGIENFL IRKGISQKVI DIFRNLTRLY GREDKIKEAK KFANNEISKL AIERLSEIYN 
NMIKLGYQNY ITIDFGMVKH LNYYTGIIFS GYIQELGYPV LNGGRYDNLC EIFGTKLYAI 
GFAIGLDRIL EWKLKNIPRN DKFYDSLVFY KEGHFKMALK LLLKTDNEKQ KIYFYTVPAK 
IEEAFLISKA MKVEKFMYID EEGVKTYVLE DLE