Gene Tpen_1664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1664
Symbol
ID	4601246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	1611141
End bp	1612352
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	60%
IMG OID	639774437
Product	aminotransferase, class I and II
Protein accession	YP_921062
Protein GI	119720567
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCCTAAAC CTACGCTGGT TTTTTCTCCC CTCGCGGAGC AACTAGAGCC TGAGGGCGCC 
TTCGTATACC TCGACTTGGC AGCCGAGGCT AGGCGTAAAG GTATAGACGT TATCAGCTTC 
GGGATAGGGC AACCCGACTT CCAGCCCCCT AGAGAAGCAC TCGAAGCAAT CAAGGAGGCG 
CTGGACAGGG GCTACACGAG GTACATCTCG CCGCTAGGCA TACCGGAGCT CCGCGAGGAG 
ATAGCGCGCT ACGTCGGCGA AAAGTACGGA GTGGACGTTA AGCCCAGCGA AGTCGCGGTA 
ACCGTGGGGG CTAAGGCAGC GCTCTTCATG ACGATCTCCC TCCTGACGAG GCCTGGAGAC 
GAGGTCGTCG TGCAGGACCC TGCGTTTCCG ACGTACGAGT GTGTTATTAG GTACGCGGGC 
GGCAGGCCTG TCTTCGTGAG GCTCGCGGAG GAGAGAGGGT TCAGGCTCTC GGCGGAGGAC 
GTCGAGAGGA CTGTAGAGGG CCTCCACAGG GTGAGGGGTA TCGTCGTGAA CTCTCCGCAT 
AACCCGACGG GCTCGGCGCT CGAGGAGAAA GACGTGGAGG CTCTACTGGA GCTGGCTAGG 
AGGAAGGGCA TGTTCGTGAT TAGCGACGAG ATATACGAGG ACTACGTGTA CGAGGGGAAG 
CACGCGAGCT TCCTCCAGGC ACCGGACTGG CGCGACTACG TCGTGTACGT GAGCGGTTTC 
TCGAAGACCT GGGCTATGAC CGGGCTGAGG CTCGGCTACG TCGTCGCCAG AGAAGAAGTC 
ATACGGGCCC TCGAAGTCTT TGCGACGAAC ATGTACAGCT GTCCGCCCGC TCCTCTCCAG 
TACGGGGCGC TCAAGGCGCT CCAGCTGGGT ACGGGCTGGT TCAAGCCGCT ACTAGAGGAG 
TACCGTAGGA GGAGGGACGC CGCTTTCGAA GAGCTCAGCA AGATACCCGG CGTTAGCACC 
GTGAAGTCCA GGGGTGCATT CTACCTCTTC CCGAACTTCA AGGAGGTTCT CCGAGCGACG 
GGCTTGAGGA GTGTGGACGA GCTTGCGAAG AGGTTACTGT TCGAGGCGGG TGTAGTTCTC 
TTACCTGGGA CTGCCTTCCC CTTGAGGGGC GGTGATGGGT ACATGCGTGT CTCGTACGTT 
TTACCGGTGG AGAAGATTCG TGAGGGGTTC GGTAGGGTTC GCGAATGGGT CGAGAAGAAT 
GCGGGTGGGT AG

Protein sequence

MPKPTLVFSP LAEQLEPEGA FVYLDLAAEA RRKGIDVISF GIGQPDFQPP REALEAIKEA 
LDRGYTRYIS PLGIPELREE IARYVGEKYG VDVKPSEVAV TVGAKAALFM TISLLTRPGD 
EVVVQDPAFP TYECVIRYAG GRPVFVRLAE ERGFRLSAED VERTVEGLHR VRGIVVNSPH 
NPTGSALEEK DVEALLELAR RKGMFVISDE IYEDYVYEGK HASFLQAPDW RDYVVYVSGF 
SKTWAMTGLR LGYVVAREEV IRALEVFATN MYSCPPAPLQ YGALKALQLG TGWFKPLLEE 
YRRRRDAAFE ELSKIPGVST VKSRGAFYLF PNFKEVLRAT GLRSVDELAK RLLFEAGVVL 
LPGTAFPLRG GDGYMRVSYV LPVEKIREGF GRVREWVEKN AGG