Gene Tpet_1239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpet_1239
Symbol
ID	5170821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermotoga petrophila RKU-1
Kingdom	Bacteria
Replicon accession	NC_009486
Strand	-
Start bp	1253510
End bp	1254559
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	47%
IMG OID	640563763
Product	ApbE family lipoprotein
Protein accession	YP_001244829
Protein GI	148270369
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGGCCGT CAGATAGCAA CGATCATCGG GTAACCAGAA GAAACGTCAT CATCTTTTCT 
TCACTTCTTC TAGGTTCTCT TGCGATTCTC TTGGCTTTAC TCCTCATCCG AACGAAAGAT 
CAGTATTATG AGCTCAGAGA TTTCGCTCTC GGAACGAGTG TGAGGATAGT CGTTTCCTCT 
CAGAAGATAA ATCCCAGAAC GATCGCAGAA GCCATTCTGG AAGACATGAA GAGGATTACC 
TACAAGTTTT CTTTCACGGA TGAAAGAAGT GTTGTGAAAA AGATAAACGA TCATCCCAAC 
GAATGGGTCG AGGTGGACGA AGAGACTTAC AGTTTGATCA AAGCGGCCTG CGCGTTCGCA 
GAGCTCACAG ATGGAGCGTT TGATCCGACA GTAGGAAGGC TTCTCGAACT CTGGGGGTTT 
ACCGGAAACT ACGAAAATCT CAGGGTACCT TCTCGAGAAG AGATCGAAGA AGCTCTGAAG 
CATATCGGAT ATAAAAACGT TCTCTTCGAC GATAAGAACA TGAGAGTGAT GGTTAAAAAC 
GGTGTGAAGA TCGATCTTGG TGGTATAGCG AAAGGGTACG CCCTTGACAG AACTAGGCAG 
ATAGCACTCT CTTTTGACGA GAACGCAACG GGGTTTGTCG AAGCAGGTGG GGATATTCGT 
ATCATCGGGC CAAAATTTGG AAAGTATCCG TGGGTGATAG GAGTAAAAGA TCCCAGGGAA 
GACAACGTGA TAGATTACAT CTATCTGAAA TCCGGAGCGG TTGCGACTTC CGGTGATTAC 
GAAAGATATT TCGTTGTGGA CGGTGTCAGG TATCATCATA TTCTCGATCC TTCAACGGGG 
TATCCTGCTC GTGGTGTGTG GAGCGTAACG ATCGTAGCCG AAGATGCCAC CACAGCCGAC 
GCACTCTCCA CAGCGGGCTT TGTGATGGCC GGAAAAGACT GGAGGAAGGT GGTGCTCGAT 
TTTCCAAATA TGGGAGCTCA TCCGCTGATA GTTCTTGAAG GAGGAACGAT CGAAAAGTCT 
GAGACCTTCA AGCTGTTCGA AAGAGAGTGA

Protein sequence

MWPSDSNDHR VTRRNVIIFS SLLLGSLAIL LALLLIRTKD QYYELRDFAL GTSVRIVVSS 
QKINPRTIAE AILEDMKRIT YKFSFTDERS VVKKINDHPN EWVEVDEETY SLIKAACAFA 
ELTDGAFDPT VGRLLELWGF TGNYENLRVP SREEIEEALK HIGYKNVLFD DKNMRVMVKN 
GVKIDLGGIA KGYALDRTRQ IALSFDENAT GFVEAGGDIR IIGPKFGKYP WVIGVKDPRE 
DNVIDYIYLK SGAVATSGDY ERYFVVDGVR YHHILDPSTG YPARGVWSVT IVAEDATTAD 
ALSTAGFVMA GKDWRKVVLD FPNMGAHPLI VLEGGTIEKS ETFKLFERE