Gene Tbd_2059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tbd_2059
Symbol
ID	3672230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiobacillus denitrificans ATCC 25259
Kingdom	Bacteria
Replicon accession	NC_007404
Strand	-
Start bp	2148900
End bp	2150270
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	71%
IMG OID	637710761
Product	4-alpha-glucanotransferase
Protein accession	YP_315817
Protein GI	74318077
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1640] 4-alpha-glucanotransferase
TIGRFAM ID	[TIGR00217] 4-alpha-glucanotransferase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.113022
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.335201
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTTTT CCGAGCGCCG CGCCGGCATC CTGCTGCATC CGACCTCGCT GCCTTCGGGC 
ACCTTCGCGG ACGCCGAGCG CTGGCTGGAT TTCCTGCACG ATGCCGGGTT CGGCGTCTGG 
CAGATGCTGC CGCTTGGCCT GCCGCTGACC GGCCTGTCGC CTTACCAGTG CGCTTCGGCT 
TTCGCGGTCG ATCCCGCGCT TTTTCCGGGC GACACCGCCG ACCCCGCCGG CTTCGAGGAA 
TGGCACCACC GGCAGCGTCA CTGGATCGAC GACTATGCGC GCTTCACGGT GATCAAGGCG 
GCGCAGGGCG GTGCCGCGTG GACCGACTGG CCGCCGCCGC TGCGCGACCG CGAGCCGGCG 
GCGCTCGCCG AATTCGAGCG TGCGCACGCC GACGCCCTGC GCACGGTCAT GCATGACCAG 
TACCGCGCCG CGCAGGCCGG GCGGAAGATT CGCGCCGCGG CTGCGGCGCG CGGCATCCGG 
CTGTTCGGTG ACATGCCGAT CTTCGTCGCG CACGACAGCG CCGACGTCTG GGCGCAGCGC 
CACCTCTTCC TGCTCGACGG CGTCGGTCAT CCGACCGTCG TCGCAGGTGT GCCGCCCGAT 
TATTTTTCCG AGACCGGGCA GCGCTGGGGC AACCCCCACT ACGACTGGGA CGCGATGCAG 
GCCGACGGCT TCGCCTGGTG GCGTGCGCGG CTGCGCGACC ATTTCGAATG GTTCGATCTC 
GTGCGCATCG ATCATTTCCG CGGGCTCGCG GCCGCCTGGG CCGTGCCGGC GAGCGAGCCG 
ACCGCGGTGC ACGGCGAATG GCGCCCGGCG CCGGGGGCGG CGCTACTGCA GGCGATGCGC 
GACGAGATGG CGGGCGAGCG AGGCGGCGGG CGCGACGATG CGGGCCTGCC GCTGGTCGCC 
GAAGACCTCG GCACCATCAC GCCCGACGTC ATCGCCTTGC GCCATCAATT TGGCCTTCCC 
GGCATGGCCG TGTTGCAATT CGCCTTCGAT GCCCACACTG ACAACCCGCA CAAACCCGAG 
AACGTGCATC CCGACACGGT CTACTACACC GGCACGCACG ACAACGACAC GACGCTGGGA 
TGGTGGATGT CCTTGCCGGA CGACGCCCGC GCGCAGGTGG TCGCGCGGCT CGGCGTCGAC 
GAGGCCGGCG CGGTGCTCGA CGCGATGATC GCGACCGTGC TCGGCAGCGC GGCCGCGCTC 
TCCGTGCTGC CGATGCAGGA TGTGCTGCGG CTCGACAATT CGGCGCGCAT GAACACGCCG 
GGCCGCGAGC AGGGCAACTG GACCTGGCGC TTCGGCTGGG ACGCGCTGCC CGACGGTCTC 
GCCGCGCGCC TGCGCGAACA ACTCCAGGCG GTCGATCGAT GCGCAAGCTA G

Protein sequence

MNFSERRAGI LLHPTSLPSG TFADAERWLD FLHDAGFGVW QMLPLGLPLT GLSPYQCASA 
FAVDPALFPG DTADPAGFEE WHHRQRHWID DYARFTVIKA AQGGAAWTDW PPPLRDREPA 
ALAEFERAHA DALRTVMHDQ YRAAQAGRKI RAAAAARGIR LFGDMPIFVA HDSADVWAQR 
HLFLLDGVGH PTVVAGVPPD YFSETGQRWG NPHYDWDAMQ ADGFAWWRAR LRDHFEWFDL 
VRIDHFRGLA AAWAVPASEP TAVHGEWRPA PGAALLQAMR DEMAGERGGG RDDAGLPLVA 
EDLGTITPDV IALRHQFGLP GMAVLQFAFD AHTDNPHKPE NVHPDTVYYT GTHDNDTTLG 
WWMSLPDDAR AQVVARLGVD EAGAVLDAMI ATVLGSAAAL SVLPMQDVLR LDNSARMNTP 
GREQGNWTWR FGWDALPDGL AARLREQLQA VDRCAS