Gene Tpet_1542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpet_1542
Symbol
ID	5170634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermotoga petrophila RKU-1
Kingdom	Bacteria
Replicon accession	NC_009486
Strand	+
Start bp	1532164
End bp	1534167
Gene Length	2004 bp
Protein Length	667 aa
Translation table	11
GC content	49%
IMG OID	640564069
Product	carbohydrate binding module 27
Protein accession	YP_001245126
Protein GI	148270666
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3934] Endo-beta-mannanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000596448
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTAGGT TTATGTTCAT TTTATCGATC GTTGCTCTCT CTTTCGTTCT CTTTGCAGAT 
GAGTTCGTGA GAGTGGAAAA CGGAAAATTC GTCCTTAATG GAAAAGAATT CAGATTCATT 
GGGAGTAACA ACTACTACAT GCACTACAAG AGCAACAGAA TGATAGACAG TGTTTTGGAG 
AGCGCCAGGG ATATGGGAAT AAAGGTGCTC AGAATCTGGG GTTTCCTCGA CGGGGAGAGT 
TACTGCAGAG ACAAGAACAC CTACATGCAT CCTGAGCCCG GTGTTTTCGG AGTGCCGGAA 
GGGATCTCAA ACGCCCAGAA TGGTTTCGAA AGACTCGACT ACACGATAGC GAAAGCGAAA 
GAACTTGGCA TAAAACTCAT CATCGTTCTT GTGAACAACT GGGACGACTT TGGTGGGATG 
AACCAGTACG TGAGGTGGTT CGGAGGAACC CACCACGACG ATTTCTACAG AGATGAAAGA 
ATCAAAGAAG AGTACAAAAA GTACGTGTCT TTCCTCATAA ACCATGTCAA CGTCTACACG 
GGAGTTCCTT ACAGGGAAGA GCCCACCATC ATGGCCTGGG AGCTTGCAAA CGAACTGCGC 
TGTGAGACGG ACAAATCGGG GAACACGCTC GTTGAGTGGG TGAAGGAGAT GAGCTCCTAC 
ATAAAGAGTC TGGATCCCAA CCACCTCGTG GCTGTGGGGG ACGAAGGATT CTTCAGCAAC 
TACGAAGGAT TCAAACCTTA CGGTGGAGAA GCCGAGTGGG CCTACAACGG CTGGTCCGGT 
GTTGACTGGA AGAAGCTCCT TTCGATAGAG ACGGTGGACT TCGGCACGTT CCACCTCTAT 
CCGTCCCACT GGGGTGTCAG TCCAGAGAAC TATGCCCAGT GGGGAGCGAA GTGGATAGAA 
GACCACATAA AGATCGCAAA AGAGATCGGA AAACCCGTTG TTCTGGAAGA ATATGGAATT 
CCAAAGAGTG CGCCAGTTAA CAGAACGGCC ATCTACAGAC TCTGGAACGA TCTGGTCTAC 
GATCTCGGTG GAGATGGAGC GATGTTCTGG ATGCTCGCGG GAATCGGGGA AGGTTCGGAC 
AGAGACGAGA GAGGGTACTA TCCGGACTAC GACGGTTTCA GAATAGTGAA CGACGACAGT 
CCAGAAGCGG AACTGATAAG AGAATACGCG AAGCTGTTCA ACACAGGTGA AGACATAAGA 
GAAGACACCT GCTCTTTCAT CCTTCCAAAA GACGGCATGG AGATCAAAAA GACCGTGGAA 
GTGAGGGCTG GTGTTTTCGA CTACAGCAAC ACGTTTGAAA AGTTGTCTGT CAAAGTCGAA 
GATCTGGTTT TTGAAAATGA GATAGAGCAT CTCGGATACG GAATTTACGG CTTTGATCTC 
GACACAACCC GGATCCCGGA TGGAGAACAT GAAATGTTCC TTGAAGGCCA CTTTCAGGGA 
AAAACGGTGA AAGACTCTAT CAAAGCGAAA GTGGTGAACG AAGCGCGGTA CGTGCTTGCA 
GGAAAGGTGG ATTTCTCTTC CCCGGAGGAG GTGAAAAACT GGTGGAACAG CGGAACCTGG 
CAGGCAGAAT TTGAGTCACC TGACATTGAA TGGAACAGTG AGGTGGGAAA TGGTGCGTTG 
CAGTTGAACG TGAAGCTGCC TGGAAAGAGC GACTGGGAAG AAGTGAGGGC AGCGAGGAAG 
TTCGAAAAGC TCTCCGAATG TGAGATCCTC GAGTATGACA TCTACATTCC AGACGTCGAA 
GGGCTCAAAG GAAGGTTGAG ACCGTACGCG GTTCTGAACC CCGGCTGGGT GAAGATAGGC 
CTCGATATGA ACAACACAAG CGTGGAAAGT GCGGAGATCG TCACTTTCGG TGGAAAAGAG 
TACAGAAAAT TCCACGTAAG GATTGAATTC GACAAGACAG CGGGGGTGAA CGAGCTTCAC 
ATAGGAATTG TCGGTGATCA TCTGAAGTAC AATGGACCGA TTTTCATCGA TAATGTAAAA 
CTCTACACAA AGGAGGCTGA ATAA

Protein sequence

MRRFMFILSI VALSFVLFAD EFVRVENGKF VLNGKEFRFI GSNNYYMHYK SNRMIDSVLE 
SARDMGIKVL RIWGFLDGES YCRDKNTYMH PEPGVFGVPE GISNAQNGFE RLDYTIAKAK 
ELGIKLIIVL VNNWDDFGGM NQYVRWFGGT HHDDFYRDER IKEEYKKYVS FLINHVNVYT 
GVPYREEPTI MAWELANELR CETDKSGNTL VEWVKEMSSY IKSLDPNHLV AVGDEGFFSN 
YEGFKPYGGE AEWAYNGWSG VDWKKLLSIE TVDFGTFHLY PSHWGVSPEN YAQWGAKWIE 
DHIKIAKEIG KPVVLEEYGI PKSAPVNRTA IYRLWNDLVY DLGGDGAMFW MLAGIGEGSD 
RDERGYYPDY DGFRIVNDDS PEAELIREYA KLFNTGEDIR EDTCSFILPK DGMEIKKTVE 
VRAGVFDYSN TFEKLSVKVE DLVFENEIEH LGYGIYGFDL DTTRIPDGEH EMFLEGHFQG 
KTVKDSIKAK VVNEARYVLA GKVDFSSPEE VKNWWNSGTW QAEFESPDIE WNSEVGNGAL 
QLNVKLPGKS DWEEVRAARK FEKLSECEIL EYDIYIPDVE GLKGRLRPYA VLNPGWVKIG 
LDMNNTSVES AEIVTFGGKE YRKFHVRIEF DKTAGVNELH IGIVGDHLKY NGPIFIDNVK 
LYTKEAE