Gene Tcr_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tcr_0020
Symbol
ID	3760385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiomicrospira crunogena XCL-2
Kingdom	Bacteria
Replicon accession	NC_007520
Strand	+
Start bp	23428
End bp	24573
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	44%
IMG OID	637784726
Product	polysaccharide deacetylase
Protein accession	YP_390291
Protein GI	78484366
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGCAG CACGGAAACT ACGTTCAATC GTTACGAGTA AACCCATCCT ATTTTTAAGT 
GGCATCGTCA CTCTGGTTGC AATCATTTCC GCATCAATCT TTTTAACGTC TGGCGCAACC 
CCTCCGCCAA AAAAAGCGGT TTCAAGCCAA TCGTCTGTTG AAAACTCAGA CAGCGCGGTG 
ATTTTAATTT ACCACCATTT TGGGAAAGAT GAATATCCCA GCACCAATAT TCGCTTAGCG 
CAACTGGATG CTCAACTCAA CTACCTTGAA CAAAACCATT TTACTGTCTG GTCGTTATCC 
CAATTAGTCA ACACATTAAA AAGCCGAGCA CCTATTCCAA ATAAAACCGT GGTTTTTACC 
ATTGATGATG CTTGGTCCAG CGTTTATACA GAAGCCTTCC CACGGTTTAA AAAACGAGGC 
TGGCCCATGA CGATTTTTGT AAATACCGAT GCGATCGATA AAGGTTACCA ATCGAATATG 
ACTTGGGAAC AAATGCGAGA AATGCAGCAA TATGGTGCGG AATTCGCCAA TCATGCTAAA 
ACGCATCAAA AATTGGTGCG ACAGCCAGAT GAATCTCATG AGGCTTGGCA GACGCGGGTC 
ACACAGGAAA TTAAGGTGGC GCAACAACGC TTAAAGTCGG AACTTGGAGA AAACACCAAT 
CAAACCAAAT TGTTGTCTTA TCCTTACGGC GAATACTCTG AAGCCTTAGC CAACCTTGTT 
CAAAAAATGG GCTATGTTGG CATTGCTCAA AACTCGGGCG CTGTTGGATA TCAATCTGAT 
CTAAGAGCCC TCATGCGCTT TCCAATGAGT GAAGTTTATG CCGACATGGA CGCCTTCAAA 
TTAAAGGTCA ATACCCATGT TTTTCCGGTC AAAAAAATCA CGCCTTTTGA TCCGGTCATC 
ACTGAAAACC CTCCTAAACT GATTTTAGAG TTCACCAGCC CTCCTCAGCG CAACATTCAA 
TGTTTTAACC AGCATGGCGA GCCTTTGTTG CTCGATTGGG CCAGCGAAAC CAAATTAGAA 
ATCACCAGTG ATTCCCCACT GGAGCCCCCT CGAAGCCGTT ATGCCTGTAC CCAAATGATG 
CCCAATGGCG ATTGGCGCTG GATAAGCCAT AGTTGGGTTA TTTCCCATAC AAACAACATG 
GATTAA

Protein sequence

MSAARKLRSI VTSKPILFLS GIVTLVAIIS ASIFLTSGAT PPPKKAVSSQ SSVENSDSAV 
ILIYHHFGKD EYPSTNIRLA QLDAQLNYLE QNHFTVWSLS QLVNTLKSRA PIPNKTVVFT 
IDDAWSSVYT EAFPRFKKRG WPMTIFVNTD AIDKGYQSNM TWEQMREMQQ YGAEFANHAK 
THQKLVRQPD ESHEAWQTRV TQEIKVAQQR LKSELGENTN QTKLLSYPYG EYSEALANLV 
QKMGYVGIAQ NSGAVGYQSD LRALMRFPMS EVYADMDAFK LKVNTHVFPV KKITPFDPVI 
TENPPKLILE FTSPPQRNIQ CFNQHGEPLL LDWASETKLE ITSDSPLEPP RSRYACTQMM 
PNGDWRWISH SWVISHTNNM D