Gene Teth514_0394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Teth514_0394
Symbol
ID	5877602
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoanaerobacter sp. X514
Kingdom	Bacteria
Replicon accession	NC_010320
Strand	-
Start bp	403081
End bp	404523
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	35%
IMG OID	641540730
Product	glycoside hydrolase family protein
Protein accession	YP_001662042
Protein GI	167039057
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1486] Alpha-galactosidases/6-phospho-beta-glucosidases, family 4 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0289899
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCATCAG TAAAAATTGG TATTATAGGT GCAGGAAGTG CTGTATTTTC TCTGAGGTTG 
GTGAGCGATT TATGCAAAAC TCCAGCGTTA TATGGAAGCT TAGTAACTCT CATGGATATC 
GATGAAGAAA GATTAGAGGC CGTGTACATA CTTGCAAAAA GGTATGTGGA AGAAGTAGGA 
GCAGAGTTAA AGTTTGAAAA AACTAAAAAT TTAGAAGATG CCATAATAGA TGCAGATTTC 
GTAATAAATA CAGCAATGGT AGGAGGACAT ACTTATCTAG AAAAAGTCAG ACAGATTAGC 
GAAAAATATG GCTATTATAG AGGAATAGAT GCACAGGAAT TTAATATGGT TTCAGATTAT 
TACACTTTCT CAAATTACAA TCAGTTGAAA TATTTCGTAG AAATTGCCAA GAAAATTGAA 
AAACTGTCTC CAAACGCCTG GTATTTACAA GCTGCTAATC CCGTATTTGA AGGCACAACT 
CTTGTAACAA GGACCTCTTC GATAAAAGCA GTTGGATTCT GCCATGGACA TCTTGCATTA 
AAAGAAGTAT TTGACACACT GGGACTTAAG CATAATAAAG TAGATTGGCA AGTAGCAGGA 
GTAAATCACG GAATATGGCT TAATAGATTT ATATATGAAG GAAAAAGTGC TTACGAAAAG 
CTCAACACCT GGATAGAGGA AAATTCTCAC AACTGGAAAC CTCTTCATCC ATTTAATGAC 
CAGCTATCCT CAGCTGCCAT TGATATGTAC AAGTTTCACG GAGTTTTGCC TGTTGGCGAT 
ACCGTAAGAA ATGCTTCTTG GCGGTATCAT AAAAACCTGG AAACAAAGAA AAAGTGGTAT 
GGAGAACCTT GGTGTGGTGC AGACTCTGAA ATAGGTTGGA AATGGTACCA AGAAACATTA 
GGAAAAATTA CAGACATCAC TAAAAAGATT GCAAAGTTCT TGATAGAAAA TCCAAAAGCA 
AAGTTTAGCG ATATAAAAGA AATTTTCGGT CAAGAGGCAA AAGACAATGA ATTACTACAG 
GAAATGGAAA AAATACTAGA CCCAGAGCAA AAAAGTGAAG AACAGCACAT TCCTTTCGTA 
GAATCGATTG TAACCGGCAA AAAAGAAAGA TTTGTAGTAA ATATACCAAA TAGAAGAATA 
ATTCCTGCAG TAGAAAATGA TGTTGTTGTA GAAGTACCTG CAATAGTAGA TAGCGAAGGA 
ATACATCCAG AAAAAATAGA ACCCATGCTC CCAGAGAGAG TAATAAAGTA TTACCTAAAA 
CCGAGAATTA TGAGAATGGA AATGGCAGTA GAAGCATTTT TAACAGGGGA CATAGACATA 
ATAAAAGAAC TTCTGTACAG AGACCCTAGA ACTCAAAATG ATGGGCAGGT AGAAAAAGTT 
TTAGAAGAAA TTCTATCCCT ACCAGAAAAT GAAGAGATGA AAAAACATTA TTTAAAAAAA 
TAG

Protein sequence

MPSVKIGIIG AGSAVFSLRL VSDLCKTPAL YGSLVTLMDI DEERLEAVYI LAKRYVEEVG 
AELKFEKTKN LEDAIIDADF VINTAMVGGH TYLEKVRQIS EKYGYYRGID AQEFNMVSDY 
YTFSNYNQLK YFVEIAKKIE KLSPNAWYLQ AANPVFEGTT LVTRTSSIKA VGFCHGHLAL 
KEVFDTLGLK HNKVDWQVAG VNHGIWLNRF IYEGKSAYEK LNTWIEENSH NWKPLHPFND 
QLSSAAIDMY KFHGVLPVGD TVRNASWRYH KNLETKKKWY GEPWCGADSE IGWKWYQETL 
GKITDITKKI AKFLIENPKA KFSDIKEIFG QEAKDNELLQ EMEKILDPEQ KSEEQHIPFV 
ESIVTGKKER FVVNIPNRRI IPAVENDVVV EVPAIVDSEG IHPEKIEPML PERVIKYYLK 
PRIMRMEMAV EAFLTGDIDI IKELLYRDPR TQNDGQVEKV LEEILSLPEN EEMKKHYLKK