Gene Xcel_1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Xcel_1037
Symbol
ID	8648547
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Xylanimonas cellulosilytica DSM 15894
Kingdom	Bacteria
Replicon accession	NC_013530
Strand	+
Start bp	1112488
End bp	1113921
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	72%
IMG OID
Product	Peptidase M23
Protein accession	YP_003325626
Protein GI	269955837
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.501943
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGACAGC ACGGGTTCGC ACGGGCGGCC GTCGGGGCCG TCCTCGTCGC GGCGCTCGGC 
TTCGGCGTCG CGGGGTCGGC CGCCGCCGAC GACATCGACG ACCGGCTCGC CGCCGCGCAG 
CGGGACGCGC AGCAACGGCG CAACGAGCGG GCAGGGCTCG AGGAGGACCT GCACGAGACC 
GACCAGAAGC TGAAGCAGGC GGTGCTGGAC CTCGACGAGG TCGAGGCGCG CCTGCCGGTC 
GCCCAGGCCG AGCTGGAACG CGCCCAGGCC GACCTGGAGA AGGCGCAGCG CGAGGCCGAG 
ATCCTCGCGC AGCGGCTCCA GGACGCCCAG GACGAGGAGG CGGCGGTCAC CGCCCAGCTC 
GCGGCCGGGG CCGGCCAGGT CGAGGCGGCC CGCGCGGACA TCGCGCAGAT GGCGCGCGAG 
GCGGCCCGCG GCCAGGGCAG CGTGTCGGCG TTCGGGATCG TCACGGGCGC GCAGTCGACC 
GAGGACTTCC TGGCGCAGTT CGCCGTCTCC TCCTCCGCGG CCCGGTCGCA GGCCCGCACG 
CTGACCGCCC TGCAGGACGC CGAGGCGCTG GCGCGCAACC AGGAGGCGCG CCTCCAGGCC 
GTCCGGGAGC AGATCGACCA GCTCAAGACG GCCGCGGACG CCAAGGTGGT CGAGGCGCAG 
GAGGCGGAGC AGCGCGCGAA GGACCGCAAG GCCGAGGTCG AGTCGCTCAT CGCGAAGCAG 
AAGAAGCTCA AGGCCCAGAT CGAGGACCAG AAGGAAGCCG CGCTCGCCGA GCTGCGCCAG 
AACGAGGCAG AGCAGAAGGC GCTCGAGGCC GACCTCAAGA AGATCATGGC GGAGCGCGAC 
GAACGTGACC GGCGCATCGA GGAGCAGCGC CGCAAGGAGG AGGAAGCGCG CAAGAAGCGC 
GAGGCCGAGG AGCGCCGCAA GCAGGAGGAG GCCGCGAAGG CGGCTTCCGG TGGCGGCTCG 
AACAGTGGCG GCGGTTCGAG CGGCGGCGGT TCCGGCGGCG GTTCCGGTGG CGGCAGCACG 
ACGCCGGTGT CCACCACGTT CCTGGGCTGG CCGACCGCCG TGCCGCACGT CACCAGCAGC 
TACGGCATGC GGTTCCACCC CGTGCTGGGC ATCTGGCGAC TGCACGCCGG CACCGACTTC 
CGCGCCTACT GCGGCACGCC GATCCTCACC TCGCAGTCCG GCATCGTGGT GCGCACCGCG 
TACGGGTCCG GGCCGGGCAA CAACATCATG ATCGACCACG GCACCGACAA CGGGCAGAAC 
ATCATGACCC GGTACCTGCA CCTGTCGAGC TTCTCGGTGA GCCAGGGGCA GTGGGTGAGC 
AAGGGGCAGG TGATCGGCCG CTCCGGCAGC ACGGGGACGT CATCGGCCTG CCACCTGCAC 
TTCGAGGTGT ACGTCAACGG CAGCACCGTC AACCCCATGA CGCGCCTGCC CTGA

Protein sequence

MRQHGFARAA VGAVLVAALG FGVAGSAAAD DIDDRLAAAQ RDAQQRRNER AGLEEDLHET 
DQKLKQAVLD LDEVEARLPV AQAELERAQA DLEKAQREAE ILAQRLQDAQ DEEAAVTAQL 
AAGAGQVEAA RADIAQMARE AARGQGSVSA FGIVTGAQST EDFLAQFAVS SSAARSQART 
LTALQDAEAL ARNQEARLQA VREQIDQLKT AADAKVVEAQ EAEQRAKDRK AEVESLIAKQ 
KKLKAQIEDQ KEAALAELRQ NEAEQKALEA DLKKIMAERD ERDRRIEEQR RKEEEARKKR 
EAEERRKQEE AAKAASGGGS NSGGGSSGGG SGGGSGGGST TPVSTTFLGW PTAVPHVTSS 
YGMRFHPVLG IWRLHAGTDF RAYCGTPILT SQSGIVVRTA YGSGPGNNIM IDHGTDNGQN 
IMTRYLHLSS FSVSQGQWVS KGQVIGRSGS TGTSSACHLH FEVYVNGSTV NPMTRLP