Gene Tpen_0539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_0539
Symbol
ID	4601053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	-
Start bp	489640
End bp	490974
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	56%
IMG OID	639773310
Product	4-aminobutyrate aminotransferase
Protein accession	YP_919948
Protein GI	119719453
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0160] 4-aminobutyrate aminotransferase and related aminotransferases
TIGRFAM ID	[TIGR00700] 4-aminobutyrate aminotransferase, prokaryotic type [TIGR00707] acetylornithine and succinylornithine aminotransferases

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACGGAC CGAAAATAAT CGTTGAGCCT CCGGGACCTA ACTCTAGGAA GATCGCCGAA 
AAGGACTCCG CACTGTTGAT GCAGAGCTTC GCGCGCTGGT ACCCCTTGGT CGCCAAGCGC 
GCACACGGCG TGTGGGTCGA AGACGTCGAC GGAAACGTCT ACCTGGACTT CAACTCCGGG 
ATAGGCGTGA CGAACACGGG GCACTGCCAC CCTAAAGTCG TCAAAGCGAT AAAAGAACAA 
GCAGAGAGGC TACTTCACTA CTCTTTGACG GACTTCCTCT ACGAGGAGCC CGTCAAACTC 
GCCGAGAAGC TTGTATCGAT AACTCCGGGA CGCTTCCCGA AGAAGGTGTT CTACACGAAC 
AGCGGAACGG AGTCCATAGA GGCAGCAATA AAGACTGCAA GAGGGCATTT CAGGGGCACG 
CGGCCCTACA TAATCGCATT TGCCGGCTCG TTCCACGGGC GAACGTACGG GTCCCTCTCC 
CTCACGAGTA GCAAGCCAGT ACAGAGAAGA CACCTAGGCC CGCTACTACC CGGCGTGTTC 
CACGCACCCT ATCCATACTG TTACAGGTGC CCCTTCAGGC AGAAGTACCC TGAATGCAAC 
CTTTGGTGCG TCGACTTCAT CGAAGAGTGG ATGCTCAAGA AGTACGTACC CCCAGAGGAG 
GTCGCCGCAT TCGTCGTAGA GCCGATAGCG GGGGAAGGCG GCTACATAGT ACCGCCGCCC 
GAGTTCTTTA AGAGGCTACG CGAGCTAGCG GACAAGTACG GAATACTCCT GGTGGTAGAC 
GAGGTCCAGA GCGGATTCGG GAGAACCGGG AAGTGGTTCG CGATAGAGCA CTTCGGAGTG 
GAACCCGACA TAATAGCCGT AGCCAAGGGG ATAGCTTCGG GGCTCCCGCT GGGCGCGATA 
ATAGGTAGGG CGGAAGTCAT GGACCTACCT CCGGGCTCCC ACGCCTCCAC CTTCGGAGGA 
AACCCCGTCA GCTGCGCCGC AGCTCTCGCA ACGATCGAGG TAATAGAGGA GGAAAAACTC 
CTGGACAACG CGACGAGAGT AGGTGAATAC GCGATGAAGA GGCTACGCGA GCTACAGGAG 
GAAATACCCT ATATAGGAGA CGTGCGTGGG AAAGGGCTCA TGATAGGCGT AGAGCTCATC 
GCGAGAGACG GTTCCCCGAA CCCAAAGCTC CTGCAGAAAA CGCTCGAGAT AGCTTTCAAG 
AAAGGCCTGC TCGTGATAGG AGCCGGGGTG AGCACTATCC GGATAGCCCC GCCCCTGATA 
ATAACCCAGC AAGAAATGGA GACCGGGCTA CGCATACTAG AAGAATCCTT GAGGGAAGCT 
TTAAAAGAGG TCTAA

Protein sequence

MNGPKIIVEP PGPNSRKIAE KDSALLMQSF ARWYPLVAKR AHGVWVEDVD GNVYLDFNSG 
IGVTNTGHCH PKVVKAIKEQ AERLLHYSLT DFLYEEPVKL AEKLVSITPG RFPKKVFYTN 
SGTESIEAAI KTARGHFRGT RPYIIAFAGS FHGRTYGSLS LTSSKPVQRR HLGPLLPGVF 
HAPYPYCYRC PFRQKYPECN LWCVDFIEEW MLKKYVPPEE VAAFVVEPIA GEGGYIVPPP 
EFFKRLRELA DKYGILLVVD EVQSGFGRTG KWFAIEHFGV EPDIIAVAKG IASGLPLGAI 
IGRAEVMDLP PGSHASTFGG NPVSCAAALA TIEVIEEEKL LDNATRVGEY AMKRLRELQE 
EIPYIGDVRG KGLMIGVELI ARDGSPNPKL LQKTLEIAFK KGLLVIGAGV STIRIAPPLI 
ITQQEMETGL RILEESLREA LKEV