Gene Tpen_0143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_0143
Symbol
ID	4600635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	118183
End bp	119541
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	59%
IMG OID	639772897
Product	FAD-dependent pyridine nucleotide-disulphide oxidoreductase
Protein accession	YP_919556
Protein GI	119719061
COG category	[R] General function prediction only
COG ID	[COG0446] Uncharacterized NAD(FAD)-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGATCGA CAATGGTGGA AAAAGTAGAC GTGGCAGTTA TCGGCGGAGG ACCCGCCGGG 
ATGACAGCGG CATCGAGGAT TAAGAGGCTG AAGCCCGAGC TACGAGTAGC TGTTTTCGAG 
AGAAGCGGCT ACGTGAGCTA CGCCCCGTGC GGGCTACCCT ACTACCTGGG AGGGCTCGTG 
GACAGTCTAG AACACCTAGT TCACTACCCC GTAAGGGTTT TCACGGAGGA AAGAGGCATA 
GAGGTCTACA CGCGCACGGA GGTTGTGGAG GTCGGGGACG GGTACCTCAG GGCTAGGGAT 
GCTAGCGGAG AGAGGACCTA CGAGTGGGGT AAGCTCCTGA TAGCTACCGG GGCTCGCCCA 
AAGGTGCCGC CCGTGGAGGG CGTAGACCTG GAGGGGGTCT TCACGCTAAG GGTGCTCGAA 
GACGGCGAGA AGGCTAGGAG GTACCTGGAA AAGGCTACAC GCGTAGCGGT CGTGGGGGGA 
GGCTACATAG GCCTCGAAGT AGCGGAGAAC CTGGTGAGGG CTGGAAAGAC GGTCCTTCTG 
TTCGAGGTTC TCGACCACGT CTTCCCAGCC GTAGACCCCG ACATGGCGCT CCTCGTGGAA 
AAGGAGCTAG CGAGGAACGG TGTCGAGCTC CACCTCGGCG AGGGGCTTAA GGGAATTCAC 
GGCAGGGACA GGGTGGAAAG CCTGGAGACC ACCAAGGGCG AGTACAAGGT GGATGCTGTC 
TTCATAGCGA CTGGTGTGGC TCCGGAGACG CGGCTAGCCG AGAAGCTAGG CGTGAAGAAA 
GGCTCGACAG GGGCTTTAAG CGTGGATAAA AGCATGAGGA CGAACGTGGA CGATGTGTAC 
GCTGCTGGGG ACGTGGCGGA AGCACTGAAC CTGGTAACGG GGAAGAACGA CTGGTTCCCT 
CTGGCCCCCG TGGCGAACAA GATGGGCTAC GTGGCCGGAG CAGCGATGGC GGGCTTGAAG 
GCAGAGTTTC CGGGGGCTGT GGGAACCTCT ATAACGAAGG TCTTCGGCCT GGAGGTTGGG 
CGCGCGGGTT TAACCACCGC CAGGGCTCAG CAGGAGGGGT TCGACCCGGT ATCGGTTATG 
ATCAACGCGA ACTCTAAAGC GAGCTACTAC CCCGGGTCTA GCGCGATGTC CGTGAAGCTA 
ATAGCGGATA GGAGGACGGG ACAGCTTCTG GGAGGACAGA TTATAGGCGG GGACGGCGTA 
CTTGCGAGGC TTAACAGCTT AGCAGTCCTA CTTTCCTTCA GGGCTAGAGT GGAGGACGCC 
TTTTTCAGCG ACCTAGGATA CGCCCCTCCG TTCTCTCCAG TTTGGGACCC AATAGTAACT 
GCCGCGCGAG TGCTACTCGG GAAGATAAGA GAAGCCTAA

Protein sequence

MRSTMVEKVD VAVIGGGPAG MTAASRIKRL KPELRVAVFE RSGYVSYAPC GLPYYLGGLV 
DSLEHLVHYP VRVFTEERGI EVYTRTEVVE VGDGYLRARD ASGERTYEWG KLLIATGARP 
KVPPVEGVDL EGVFTLRVLE DGEKARRYLE KATRVAVVGG GYIGLEVAEN LVRAGKTVLL 
FEVLDHVFPA VDPDMALLVE KELARNGVEL HLGEGLKGIH GRDRVESLET TKGEYKVDAV 
FIATGVAPET RLAEKLGVKK GSTGALSVDK SMRTNVDDVY AAGDVAEALN LVTGKNDWFP 
LAPVANKMGY VAGAAMAGLK AEFPGAVGTS ITKVFGLEVG RAGLTTARAQ QEGFDPVSVM 
INANSKASYY PGSSAMSVKL IADRRTGQLL GGQIIGGDGV LARLNSLAVL LSFRARVEDA 
FFSDLGYAPP FSPVWDPIVT AARVLLGKIR EA