Gene Slin_4384 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4384
Symbol
ID	8728144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	5319780
End bp	5321120
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	54%
IMG OID
Product	xylose isomerase
Protein accession	YP_003389164
Protein GI	284039234
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0452947
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGACG TTAAATTGAC CCTCGGCGAG AAAACTTACT TTCCGTTCAT AGAAAAACCA 
ATTGCCTACG AAGGCCGTGA ATCGGATAAT CCGTTGGCCT TCAAGTTCTA CGACGCCAAC 
CGACTCATTC TGGGCAAACC GATGAAGGAT CTGTTCCGGT TTGCTACGGC TTACTGGCAT 
ACCTTCTGCG GTACCGGAGC CGACCCCTTT GGTCCGGGTG TCAAGCATTT TCCCTGGGAT 
GCCAACCCCG ACCCGCTGGC CGCTGCCCAT GATAAGATGG ATGCCGCTTT CGAGTTTATC 
ACCAAAATAG GCATGGAGTT TTACTGCTTC CACGATGTAG ACGTGGCCCC CGAAGGAAAC 
TCTAACAGTG AATTCGAGAA GAACTTCCGG GCTATTGTCG ACTACGCCAA ACAGAAGCAG 
GCCGCCAGTG GTGTAAAACT GCTGTGGGGC ACGGCCAACC TGTTCTCGCA CGAGCGGTAC 
ATGAACGGGG CCTCCACCAA CCCTGATTTT CACGTGCTCG CCCATGGTGG CTGGCAGGTG 
AAAAACGCCA TCGACGCCAC CATCGAACTC GGGGGCGCAG GCTATACTTT CTGGGGAGGC 
CGGGAAGGGT ACATGTCGCT GCTGAATACC AACATGAAAC GGGAGCAGGA ACACCTGGGC 
AAGTTTCTGC AAATCAGCCG CGATTACGCC CGTAAGCAGG GTTTTAAAGG TTCGTTTTAC 
ATCGAGCCCA AACCGATGGA GCCCACCAAA CACCAGTACG ATTTCGATGC AGCAACGGTT 
GTCGGTTTCC TGAATCGCTT TGGCTTACAG GACGACTTCG AGCTAAACAT CGAAACCAAC 
CACGCCACCC TAGCTAATCA TACGTTTGCC CACGAATTGC AGATTGCCGC CGATAACAAC 
ATGCTCGGCA GCATCGACGC CAACCGGGGC GATTACCAGA ATGGCTGGGA TACCGACCAG 
TTTCCGGTAG ATGTATACGA ACTGACGGAA GCCATGCTGG TCATTCTGGA AGCGGATGGC 
CTCAAATCCG GCGGGGTTAA CTTCGACGCC AAGACGCGCC GGAATTCAAC CGACCTGGAC 
GATATTTTCA TCGCCCACAT TGGCGGCATG GACACCTTCG CACGGGCAGC CATCGCGGCC 
GAAGCCATTC TTGATAAGTC GCAGTACCGG AAACTCCGCG CCGAACGTTA CGCCAGCTAC 
GACTCGGGCG AAGGTGCCCG TTTCGAAAAA GGTGAGTTAA CGCTGGAAGA CCTGCGCCAG 
TATGCCATGA CCAATGGCGA GCCCAAACAA CTCAGCGGCA AACAGGAGCT GTATGAAATG 
ATCGTTAATC AGTATATTTA A

Protein sequence

MSDVKLTLGE KTYFPFIEKP IAYEGRESDN PLAFKFYDAN RLILGKPMKD LFRFATAYWH 
TFCGTGADPF GPGVKHFPWD ANPDPLAAAH DKMDAAFEFI TKIGMEFYCF HDVDVAPEGN 
SNSEFEKNFR AIVDYAKQKQ AASGVKLLWG TANLFSHERY MNGASTNPDF HVLAHGGWQV 
KNAIDATIEL GGAGYTFWGG REGYMSLLNT NMKREQEHLG KFLQISRDYA RKQGFKGSFY 
IEPKPMEPTK HQYDFDAATV VGFLNRFGLQ DDFELNIETN HATLANHTFA HELQIAADNN 
MLGSIDANRG DYQNGWDTDQ FPVDVYELTE AMLVILEADG LKSGGVNFDA KTRRNSTDLD 
DIFIAHIGGM DTFARAAIAA EAILDKSQYR KLRAERYASY DSGEGARFEK GELTLEDLRQ 
YAMTNGEPKQ LSGKQELYEM IVNQYI