Gene Tpet_0633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpet_0633
Symbol
ID	5170604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermotoga petrophila RKU-1
Kingdom	Bacteria
Replicon accession	NC_009486
Strand	-
Start bp	635786
End bp	637720
Gene Length	1935 bp
Protein Length	644 aa
Translation table	11
GC content	45%
IMG OID	640563140
Product	Alpha-N-arabinofuranosidase
Protein accession	YP_001244229
Protein GI	148269769
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3534] Alpha-L-arabinofuranosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGAAAAGA ATGATTTGAG GGGTGAGAAA GTGAAAAGAT TCCTGTTTGT TTTGACTTTA 
ACAATTTCGG TCCTCCTCGT CGGAGAGGTT CAACATGTGT TGAGGATTGA CTTTTCTCGG 
CAGGGGCCGG AAATTCCAGA GACATTTCAT GGAATATTTT TCGAAGATAT AAATCACGCA 
GTCGATGGAG GACTTTACGT AGAACTTGTG AGAAACAGAT CGTTTGAGCA GAAAACGAGA 
AAGTACGAAG GGTGGCAGAT CGAAAGAGGA GATTCTGTGA AATCTTCCAT AGAAGAAACG 
TATCCTCTCA ACGAAAACAA CACTCATTAT TTTGAATTGA AATTTCCCGA AACAGATAGA 
GCGACTCTCA CGAACCTGGG ATACGGTGGA ATTGTGGTGT TTCAGGGTCA GGAATACACC 
TTCTCCACCT ATCTCAGTGG TGATTTCACA GGAACGATCA CCGCTTTGAT CACTGATGAC 
AACGAAGTTC TGGCTTCAGG GAATGTTTTG CTTCATCAAC CGGCTGGTGG CTGGAAAAAG 
TACATGTTGA ATCTCATTCC CACAAAGACA TCCACCAACT CGAGACTTTC GATTTCCATT 
CTGGGCAGTG GAACCCTCAG AATCGACATG GTTTCTCTGA TGCCCAGAAA GAACTGGAAC 
GGCATGAGAG AAGATCTTTT GAGAATGCTC GAGGATCTAA AGCCAGGTTT TATAAGGTTT 
CCGGGAGGAT GTCTGGTTCA GGGTAACACC CTGGAGAACG CGTACCGATG GAAAGAGAGC 
ATTGGATCAG TTGAACAGAG GAAGACAAAG TGGAATTTCT GGGGATACTA TCAGACACTT 
GGTATCGGTT TTTACGAGTA TTTGCTCCTC TGTGAAAGAC TGGAAGCAGA ACCTGTTCCT 
ATATTCAATC CTGGTATATC TTTCCAGATA GAATCACCGG AATACGCTTC CGAAGAAGAG 
CTCAAAGAAT GGATTCAAGA CGTTCTAGAT TTCCTCGAGT TTGCCAACGA TGCAACAGAC 
ACGTACTGGG GAGGTGTCAG AGCGTCTCTT GGTCATCCAG AACCCTTCAA CGTGAAATAC 
ATTGGTGTTG GTAATGAAAA CTGGGGGCCA AGATACTGGG AGAATTTCGA AAAGTTCAGA 
GAAGCGATAA AAAAAAGATA TCCCGATGTA AAGATCATAT TCAGCGGACC GCCTTCCTAC 
GAAGGAACCG ATTTCAGACA GGCGTGGCGC TGGGCAAGGG AAAACAACGT GGAAATCTTC 
GACGAGCACA TCTATGCCTC ACCGGAATGG ATGCTGGCAA ACACTGATAG ATACAACAGA 
TATGACAGAA ACGGTCCGAA AGTTATGCTT GGAGAGTACG CGGCGCATAC AGATGGAAAG 
AGAAACAACT GGCAGGCAGC ACTCGCTGAA GCAGCTTTTC TTACAGGAGT CGAGAGGAAT 
TCCGATGTTG TCATAATGGC TTCCTACGCT CCCCTCTTCA ACAGAGTGGG CTGGTCTCAG 
TGGGTACCGG ATCTGATCTG GTTCGATGGA TACAGGGTTT TCGGTACACC GAGTTACTAT 
GTCCAGAGAG TTTTCGCTGA GAACAGAGGA GATGTGGTGA TTCACTCCGA ACTCACCAAC 
GAAGAGTACA GGATGTTCGG CTACAGATAC AAACATCTCT ATCATGTAGT AACGTACGAT 
GAAAAATCTA AGGAATTGAT CATAAAAGTT GTCAATCCCT GGCCTGAAGA TAGGACCGTT 
CGTCTGGAAA TTCAGGGAAT TGGGCTCGAA GGAAATGGAA AGGAGATTCT CATCAGTGGT 
GGCCCAAAGG ATGAAAACAG TTTCGATGAA CTAAAGATCG TTCCAAAAGA AAGAATAATA 
ACCGGTCTCA ACACTTCCTT TGAATACACC TTTAAAGCTT ACACAGTGAC GGTTTTGAGA 
TTGAAGGTGA GATAA

Protein sequence

MEKNDLRGEK VKRFLFVLTL TISVLLVGEV QHVLRIDFSR QGPEIPETFH GIFFEDINHA 
VDGGLYVELV RNRSFEQKTR KYEGWQIERG DSVKSSIEET YPLNENNTHY FELKFPETDR 
ATLTNLGYGG IVVFQGQEYT FSTYLSGDFT GTITALITDD NEVLASGNVL LHQPAGGWKK 
YMLNLIPTKT STNSRLSISI LGSGTLRIDM VSLMPRKNWN GMREDLLRML EDLKPGFIRF 
PGGCLVQGNT LENAYRWKES IGSVEQRKTK WNFWGYYQTL GIGFYEYLLL CERLEAEPVP 
IFNPGISFQI ESPEYASEEE LKEWIQDVLD FLEFANDATD TYWGGVRASL GHPEPFNVKY 
IGVGNENWGP RYWENFEKFR EAIKKRYPDV KIIFSGPPSY EGTDFRQAWR WARENNVEIF 
DEHIYASPEW MLANTDRYNR YDRNGPKVML GEYAAHTDGK RNNWQAALAE AAFLTGVERN 
SDVVIMASYA PLFNRVGWSQ WVPDLIWFDG YRVFGTPSYY VQRVFAENRG DVVIHSELTN 
EEYRMFGYRY KHLYHVVTYD EKSKELIIKV VNPWPEDRTV RLEIQGIGLE GNGKEILISG 
GPKDENSFDE LKIVPKERII TGLNTSFEYT FKAYTVTVLR LKVR