Gene Tpen_0423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_0423
Symbol
ID	4602102
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	384343
End bp	385791
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	57%
IMG OID	639773188
Product	hypothetical protein
Protein accession	YP_919835
Protein GI	119719340
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTAGAG GCATGACGGG GGGTGAAGAG GGCGAGGAGG TTGTTAGGGA GCTTGTCTAC 
GAGAGGGCGG CTCAAAGCTT GTATGCCACC AGAACAGAGG ATAAGAGGAG GTCCAGAGGT 
AAGAAGAAGA GGGGCGAGAT ACACTACGTG GGCCTCTTCG ACGCGGTGAC CGGGATTAAC 
TGGGACTTTA CCAGGTTTGC GGCGCACGCG CTGACCGTCG TGCCGGACGA AGTCTACCCG 
AGGTTTTACC GCTTCATAGA CATCGACGCG AGGAAGTACC TCCTACTGGG AGACGACGAG 
AAGCCACGCG AAGGAAGCGC GGCGATGGAG CTACGCAATA GGCTACAAGC AATTGTCGAT 
GCAACAGAAG ACGGGCTTAG AGCTGAGAAG AAGGGTAAAG TCTGGCGCGT GTACGTGCCG 
CACGAGAACT GGTACGTAAC TGTCTCGAGG CCCAGTACTC ATAGCTGGTC CATACACGTC 
CCATTGGAGG GCTTCTGGAC CGAGGCTAGT TTCCCGGAGG TTCTCGCGAG GACATCGCCA 
GACGTGCTTA GAAGCCTGCA GAGAGGGTGG CTTCTCACAG ATGTCACTCC GCCACACGGA 
CGCAACAGCG ACGTAAATTT CAGTACCACT CAGCCATGGC AGTTGCCGGC AACGCTCGCC 
AACTTCCCGG GAGAAGTCAG GCTCGGCGTC ACAGCAGGAG TCCTCGGCTC CACGAGGGCG 
AGCATTAAGT GGAAGGCCTA CGTTCACGGT TACGCGGAGG AGCTGGGTTG GGCTTCCGAA 
CTCATCGGCG AGGCGAAGCG CGCTGAGTAC CGCAGGCTGG TCGACGAGTG CAGGGCGCTA 
CGGGGAGACA GCGTAGCTCT TTTGACCGCC TTTTTGGGAG ATGGTATGCT TGCTTTCTTT 
CTAAGGCTTC GGATGCTCTT CTTCAGGATA GGCAACGAGA CTCTCTACCT CCCAGCTAAG 
AGCGCCATTG TCAACGTTCG CTTGGCTGTG GAAAGGGCTA GCGAGTACGT ACGCTTTGTC 
TCGCTGGTCA CGAAGAACCC GAAGATCCGG CACTTCCTGT TCGTCGGCTT CGGATTGCCG 
CAGAAGAGGG GTAAGAAGGG CGGGCAGAGA AACAGCCCAT TCTACGCAAA CATTGCAGGG 
GCTAGGCTAC TTCTGGCCTA CGTATCCAGT ACTAACAACA TCTACGCTAG GATCGTGGTT 
GATGCTGTGC CTCAAGGCTG GTACGAGCAC GCGCTGGAGG AAGGCTGGGA CGTGAGGATA 
GTTGCTTCGG GTACCTCTTC GGGTGGCAAG GAATACTACC AAGTGACGCA AAGCTCTCTC 
TTCGAGCACG CCCGCTACGA CGCGGCTCTG CGGGAAACAC TCCTCGCCTT CGCGAAAGCG 
AAAGCCGAGC AGTACCCCAA AGCCTGGGAA CTCGTAGAGC GCCTCGAAAA GCTGGGGACA 
GAAGACTAA

Protein sequence

MGRGMTGGEE GEEVVRELVY ERAAQSLYAT RTEDKRRSRG KKKRGEIHYV GLFDAVTGIN 
WDFTRFAAHA LTVVPDEVYP RFYRFIDIDA RKYLLLGDDE KPREGSAAME LRNRLQAIVD 
ATEDGLRAEK KGKVWRVYVP HENWYVTVSR PSTHSWSIHV PLEGFWTEAS FPEVLARTSP 
DVLRSLQRGW LLTDVTPPHG RNSDVNFSTT QPWQLPATLA NFPGEVRLGV TAGVLGSTRA 
SIKWKAYVHG YAEELGWASE LIGEAKRAEY RRLVDECRAL RGDSVALLTA FLGDGMLAFF 
LRLRMLFFRI GNETLYLPAK SAIVNVRLAV ERASEYVRFV SLVTKNPKIR HFLFVGFGLP 
QKRGKKGGQR NSPFYANIAG ARLLLAYVSS TNNIYARIVV DAVPQGWYEH ALEEGWDVRI 
VASGTSSGGK EYYQVTQSSL FEHARYDAAL RETLLAFAKA KAEQYPKAWE LVERLEKLGT 
ED