Gene Tpen_1073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1073
Symbol
ID	4601651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	1011424
End bp	1012392
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	61%
IMG OID	639773850
Product	respiratory-chain NADH dehydrogenase, subunit 1
Protein accession	YP_920475
Protein GI	119719980
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.781085
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTCGACA TTGTCCTCGG CGTCCTGGTC TTCCCCGGGC TCCTGTTCAC CGTGGCTATG 
GGCTTCTGGT TCGAGTACCT CGAGAGAAAA GTTACCGCGA GGATCCAGAG AAGGGTGGGC 
CCCTTGTACG CGGGCCCCCA CGGGCTTCTC CAACCCGTCT ACGACTTCTT CAAGCTTCTC 
TTGAAGGAGG AGATAGTCCC TGGGTGGACC GACGTCTTTA CGTTCAGGGT CGCGCCGATC 
CTAGCCGTAA CCATACCTGT CTTCGGTATG TGCGTCCTCC CGGTGGCGAG CACCAAGGGC 
CTGCTGTCGT TCGAAGGTGA CTTCGCGCTA GTTTTCCTTT TGCTGGCGCT CGGCGTGCTG 
ACCCTGTCCC TCACCGGCTA CTCCGTCCTA AGCCCCTACA CGGCGATAGG TGTTGGAAGG 
CTCCTCGTGC AGTACTCGAT GTACGAAGGG GTGTTCCTCT TAAGCCTTGC GTCGGCCGCC 
CTGCAGGCGA AGACAATGAG CTTCGAAGGC ATACTCGCGT ACCAGGAGTC CCACGGCTTC 
CTCGGTCTCT ACCAGCCGGT CTCGCTCGCC GCCGCGCTCG TCGCGCTACT AGCTAAGCTC 
GAGAAGCGCC CCTTCGACCT CCCCCACGCC AAGCAGGAGG TCGTAGCGGG CTGGATGACC 
GAGCTCAGCG GGAGGGGTCT AGCCTTCATG AGGCTCTACG AGGACTTGAG CATGGTTTGG 
GGGATAGCGC TCATAGTCGT AGTTTTCCTC GGGGGACCGC TGGGCCCCGG CTACAAGGAG 
CTGGGCGCGC TGGCCGGTTT CGCGTGGTTC GCGCTGAAAT CGCTAATCGT CGCACTTGCA 
GTCATCCTCG TTAGCGCGAC TACGAGTAGA GTCAGGGTCT ATGGGCTCGC GGAGGTCTTC 
TGGAAGAGGG TTTACCCGCT AGTCCTGCTC CAGCTAGTCG TGGCGTTCCT TCTGGGGTGG 
TGGGCGTGA

Protein sequence

MLDIVLGVLV FPGLLFTVAM GFWFEYLERK VTARIQRRVG PLYAGPHGLL QPVYDFFKLL 
LKEEIVPGWT DVFTFRVAPI LAVTIPVFGM CVLPVASTKG LLSFEGDFAL VFLLLALGVL 
TLSLTGYSVL SPYTAIGVGR LLVQYSMYEG VFLLSLASAA LQAKTMSFEG ILAYQESHGF 
LGLYQPVSLA AALVALLAKL EKRPFDLPHA KQEVVAGWMT ELSGRGLAFM RLYEDLSMVW 
GIALIVVVFL GGPLGPGYKE LGALAGFAWF ALKSLIVALA VILVSATTSR VRVYGLAEVF 
WKRVYPLVLL QLVVAFLLGW WA