Gene Xcel_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Xcel_2021
Symbol
ID	8649551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Xylanimonas cellulosilytica DSM 15894
Kingdom	Bacteria
Replicon accession	NC_013530
Strand	-
Start bp	2178327
End bp	2179736
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	75%
IMG OID
Product	peptidase M20
Protein accession	YP_003326598
Protein GI	269956809
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.89722
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCGCTC AGAGCCCCGT TCCCGCCCCC GCGCCCGACA ACGCCGTCGT CGAGACCCTG 
CGTGCCGTCG TCGACGAGCA GTTCCCGGCC CTCCAGGACG ACCTCGTCTC GCTCGTGCGC 
ATCCCGAGCA TCGCCATGGC CGCGTTCGAC CAGGCCCACG TCGAGGCGTC CGCCCAGGCG 
GTGGCCGAGC TGCTGCGCGG CGCCGGCCTG CCGGAGGTGC AGGTGCTGCG GTCGCTGCGG 
CCCGACGGCG AGCCCGGCGC TCCCGCCGTC GTCGCACGCC GGCCGGCCCC CGCGGGCGCC 
CCGACCGTGC TGCTGTACGC GCACCACGAC GTCCAGCCCG TGGGGGAGGG CTGGGAGACC 
GACCCGTTCG ACCCAGTCCA GGTCGGCGAG CGCCTGTTCG GGCGGGGTGC GGCCGACGAC 
AAGGCGGGCG TCGTCGCCCA CCTGGGCGCG TTGCGCGCGC TGACGGCGGC GAACCTGATG 
CCCGAGGTCG GGGTGACCGT GTTCGTCGAG GGCGAGGAGG AGGACGGCTC GCCGTCCTTC 
CGTGCGTTCC TCGAGGAGCA CCGCGAGCTG CTGGCGGCCG ACGTCATCGT CGTCGCCGAC 
TCCGCCAACT GGAAGGTGGG CGTCCCGGCG CTCACGACGT CGCTGCGCGG CCTCGTGGAC 
GGCTTCGTCG AGGTGCAGGT GCTGGACCAC GCCGTGCACT CCGGCATGTT CGGCGGTCCG 
GTGCTCGACG CGCTCGCGCT GCTCTCGCGT CTGGTCGCCA CGTTGCACGA CGACGCCGGC 
GACGTCGCGG TGGCGGGCCT CGTGCAGGCG CCGGAACCGG CCGTGGAGTA CGACGAGGCG 
GCCTACCGCG ACGAGTCGTC GGTGCTCGAC GGCGTCCGCC TGGCCGGCAC CGGGTCCCTC 
GCGGCGCGGA TGTGGACCAA GCCGGCGCTG TCCGTGATCG GCATCGACGC GACCCCCGTC 
GCGCATGCCT CCAACACGAT CGCGCCGAGC GCGCGGGCGA AGCTCTCGCT GCGTCTGGCG 
CCGGGGCAGG ATCCGCAGGC TGCGGCGGCC GCCCTGGAGG CGCACCTGCT GGCGCACGCC 
CCGTTCGGCG CCCGGGTCAC GTGGACCACC AAGGAGCAGG GCAAGCCGTT CCTCGCGCCC 
GCCGACACCG CCGCGATGCG TGCGGCCCGC GCCGCGTTCG CGGCGTCGTG GGGCACCGAA 
CCGGTCGACA CCGGCATCGG CGGCTCGATC CCGTTCATCG CCGACCTGCT CGAGGTGTTC 
CCGCAGGCCG CGATCCTGGT GACCGGCGTC GAGGACCCGG ACTCGCGCGC GCACGGCGCG 
AACGAGTCGG TCCACCTCGG CGAGCTGCGC AAGGTCGTGG TCGCCGAGGC GCTGCTGCTC 
ACCCAGGTGG CCGCGACGCT GGGCAGGTGA

Protein sequence

MTAQSPVPAP APDNAVVETL RAVVDEQFPA LQDDLVSLVR IPSIAMAAFD QAHVEASAQA 
VAELLRGAGL PEVQVLRSLR PDGEPGAPAV VARRPAPAGA PTVLLYAHHD VQPVGEGWET 
DPFDPVQVGE RLFGRGAADD KAGVVAHLGA LRALTAANLM PEVGVTVFVE GEEEDGSPSF 
RAFLEEHREL LAADVIVVAD SANWKVGVPA LTTSLRGLVD GFVEVQVLDH AVHSGMFGGP 
VLDALALLSR LVATLHDDAG DVAVAGLVQA PEPAVEYDEA AYRDESSVLD GVRLAGTGSL 
AARMWTKPAL SVIGIDATPV AHASNTIAPS ARAKLSLRLA PGQDPQAAAA ALEAHLLAHA 
PFGARVTWTT KEQGKPFLAP ADTAAMRAAR AAFAASWGTE PVDTGIGGSI PFIADLLEVF 
PQAAILVTGV EDPDSRAHGA NESVHLGELR KVVVAEALLL TQVAATLGR