Gene Tpen_0081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_0081
Symbol
ID	4600811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	-
Start bp	63192
End bp	64388
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	54%
IMG OID	639772835
Product	aminotransferase, class I and II
Protein accession	YP_919494
Protein GI	119718999
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGCTGGG AAACAAGCTT TCGCCTAAGT AAAGCCGCCT CCCAGCTAGG AGCAGAGGAG 
GCTTTTGTCT ACCTTGCGCG GAGCCTCGAG CTCAAAAGAA GAGGGGTCGA CGTCGTCTCC 
TTCGGTATAG GGCAACCGGA CTTCCAGCCT CCGCCGCACG TGATATCTGA GGCTAAGAAG 
GCGATGGACG AGGGGTTCAA CGGCTACGGT CCAAGCCTGG GAATGCCGGA GTTACGGGAA 
GCTATAGCGA GCTTCGTGTC AGAGGAATAC GGAGTGGACG TGAAGGCGGA GGAGGTAGCC 
GTTACTGTTG GAGCTAAATC AGCGATCTTT ATGGCCATGA TATCACTGTT GGAGCCCGGA 
GACGAAGTAA TAATACCTGA CCCCTCTTAC CCCCTCTATG AGTCCGTCGC ACGCTTCGCC 
GGTGCCAAGC CTGTCTTCCT GCGCCTCCAC AGGGGCAACG GCTACAAGGT GACCTTCGAA 
GAGGTAGAGA AGCTCGTAAC TCCCAAGACT AGAATGATCG TTCTAAACTA CCCGGAGAAC 
CCCGTGGGCA CCACCATGGA TCAAAGGGAC GTGGAAGAGC TTGTCGATTT CTCGGCTAAG 
CGTGGCATAG TCGTACTGTC GGACGAGATA TACGACCACT TTGTCTACGA GAAAAAGCAC 
TTTTCTACTT TGCAGACGTC GAGTTGGCGC GACGCCGTCT ACTACGTGAA CGGTTTTTCG 
AAGACCTTTG GGATGACGGG CTGGAGGCTG GGCTACGTCA TCTCTAATAA AGAGCTGATC 
TCCAAGCTAT CAGTGGTCGC CAACAATATC TACTCCTGCC CGGTAACCTT CGAGCAGATA 
GCCGCTGCGA AGGCCCTGAA GGAAGGCTTG TCTTGGTTTA AACCCATACT CGAGGGGTAC 
AGGAAGAGGA GGGACCTCAT ATACAGGGAG TTTCTCTCGA TAAAAGGCGT AAAAGTCGTA 
AAGCCCGAGG GGGCTTTCTA CATATTCCCG GACTTTACTG AGGTGATACG GGAGAAAGGG 
CTGAAGAATG AGCGCGAGCT TGCGGACAGG CTACTAGAGG AGAGAGGCGT AGTGGTTCTG 
CCTGGGACAG CTTTCCCGAA GGAGGGTGGG AAGGGGCACC TAAGGTTCTC CTTTGCTGTG 
AGTGAGAACG ACATTGTAAG GGGCATTGCG AGGATTAAGG AGTGGATAGA GTCCTGA

Protein sequence

MGWETSFRLS KAASQLGAEE AFVYLARSLE LKRRGVDVVS FGIGQPDFQP PPHVISEAKK 
AMDEGFNGYG PSLGMPELRE AIASFVSEEY GVDVKAEEVA VTVGAKSAIF MAMISLLEPG 
DEVIIPDPSY PLYESVARFA GAKPVFLRLH RGNGYKVTFE EVEKLVTPKT RMIVLNYPEN 
PVGTTMDQRD VEELVDFSAK RGIVVLSDEI YDHFVYEKKH FSTLQTSSWR DAVYYVNGFS 
KTFGMTGWRL GYVISNKELI SKLSVVANNI YSCPVTFEQI AAAKALKEGL SWFKPILEGY 
RKRRDLIYRE FLSIKGVKVV KPEGAFYIFP DFTEVIREKG LKNERELADR LLEERGVVVL 
PGTAFPKEGG KGHLRFSFAV SENDIVRGIA RIKEWIES