Gene TRQ2_1044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TRQ2_1044
Symbol
ID	6092475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermotoga sp. RQ2
Kingdom	Bacteria
Replicon accession	NC_010483
Strand	-
Start bp	1088250
End bp	1089446
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	46%
IMG OID	642488238
Product	argininosuccinate lyase
Protein accession	YP_001739074
Protein GI	170288836
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0765305
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAAA AACTCTGGGA AAAGGGCTAC AAAGTCAACG AAGAAGTAGA AAAATTCACC 
GTCGGAGACG ATTACGTAAC GGACATGAAG ATCATAGAAT ACGACATAAA GGCCTCCATA 
GTACACTCCA GGATGCTACA CAAAATAGGC CTTCTGAGTG CGGAAGAACA AAAGAAAATA 
GAAGAAGCGC TCAGTGAACT CCTCAATCTT GTAAAAGAAG GAAAGTTCCA GATAAAACCG 
GAGGAGGAAG ACTGCCACAC TGCCATCGAG AACTTCCTCG TGAAAAAGCT TGGAGAGATC 
GGAAAAAAGA TACACACCGC TCGCTCAAGG AACGATCAGG TCTTAACCGC ACTGAGACTC 
ATGTACAAGG AAGAATTGAA AGAGATAGAA AACCTCATCA GAGAGCTCCA AAAGAGCCTG 
GAAAGATTCA TAGAAAAGTT CGGTGACGTG AAATTTCCAG GATACACCCA CACCAGAAAG 
GCGATGCCAA CTGATTTTGC AACGTGGGCT GGGGCGCTGA AAGACGCCCT CGAAGACGAT 
CTGAAACTTC TAAAAACAAC TTACGAAATC GTAGATCAAT CTCCTCTGGG GACGGGAGCT 
GGCTACGGTG TTCCCATCGA CATAGACAGA GAGTTCACAG CGAAAGAACT CGGATTCTCG 
AGGGTCCAGT GGAATCCCAT CTACACCCAG AACAGCAGGG GAAAGTTCGA ATATCTTATT 
CTTCACACGC TCTCTCAGAT ATCTTACGAT CTGAACCGGT TCGCCTCCGA TATCATATTC 
TTTTCTCTTC CAGAGATAGG TTATCTCAAA CTGCCAAAAG AGCTCTGCAC GGGAAGTTCC 
ATCATGCCGC ACAAGATAAA TCCGGATCCA CTGGAACTCG TAAGGGCCTA CCACCACGCG 
ATAGTTTCGA AGATGCTGAT GGCAGTCACT CTGCCGTCGA ATCTCATCTT CGGCTACCAC 
AGAGATTTCC AGCTTCTGAA GAAGCCGATG ATAGAGGCTT TCGAAGTTGT TAAGAATATC 
GTAAGAATAA TGAAAATAAT TTTTGACCAT CTTGAAGTTG ATAAAGAAAG ATCTGAGTCT 
AGTATTACTG AGGAAGTACT GGCCACACAC AGGGTCTATG AACTGGTGAA GCAGGGAGTA 
CCATTCCGAG ACGCTTACAG GATGGTGGCG GAAAAGTACG GGAGGGAAAA AGATTGA

Protein sequence

MSEKLWEKGY KVNEEVEKFT VGDDYVTDMK IIEYDIKASI VHSRMLHKIG LLSAEEQKKI 
EEALSELLNL VKEGKFQIKP EEEDCHTAIE NFLVKKLGEI GKKIHTARSR NDQVLTALRL 
MYKEELKEIE NLIRELQKSL ERFIEKFGDV KFPGYTHTRK AMPTDFATWA GALKDALEDD 
LKLLKTTYEI VDQSPLGTGA GYGVPIDIDR EFTAKELGFS RVQWNPIYTQ NSRGKFEYLI 
LHTLSQISYD LNRFASDIIF FSLPEIGYLK LPKELCTGSS IMPHKINPDP LELVRAYHHA 
IVSKMLMAVT LPSNLIFGYH RDFQLLKKPM IEAFEVVKNI VRIMKIIFDH LEVDKERSES 
SITEEVLATH RVYELVKQGV PFRDAYRMVA EKYGREKD