Gene Xfasm12_2003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Xfasm12_2003
Symbol
ID	6121087
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Xylella fastidiosa M12
Kingdom	Bacteria
Replicon accession	NC_010513
Strand	+
Start bp	2086827
End bp	2089265
Gene Length	2439 bp
Protein Length	812 aa
Translation table	11
GC content	60%
IMG OID	641649955
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_001776503
Protein GI	170731070
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3525] N-acetyl-beta-hexosaminidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00352357
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCCCA CCCCAGCCCG CCCAACGCAG GAACCCCCAT TACTGCGGGC ATTGCTCACC 
CTGTGCATTG CCGCACTGTC AACAACGAGC TTCGACACCA CCGCATCACA TCATAAAAAA 
TCACAACACC CATTACCCCC GAGAACTGCT TCCGGCCCAC CACTACCACC ACTGCCACTG 
ATCCCTGCAC CCGTTCAAAT ACAACGCGGT CACGGCCAAA TCCACATTGG CCCCCACACC 
CTGATTTCCA TCCCCCCCAA CGATACCGAC GCACAACACA GCGCCACCTA CCTAGCCACA 
CTGCTACAGC ACACCCGCAA CCTGACATTA CACATCCACA CCGAAACCAC CCCCACCCCA 
GACAGCATCC GCCTACAACG CGACCCACAA TCACCCGTCA CTCAGACAGA AGGCTACACC 
CTGCAAGCCC TCCCCAACCA AGGCATGCAT ATCACGGCAC GAGACGGAGC AGGACTGTTC 
TACGGCGCGA TCACTGCATG GCAACTACTG ACTGCCGACA GCAACCAAGG CCCAACCGAA 
ATCCCTACCG TCACCATTCA CGACTGGCCA CGCTTCAAAT GGCGCGGCCA ACTCCTTGAC 
GTCGCCCGTC ACTTCCACGA CGTAGACACC GTCAAACACG TGATTGACGC CATGGCACAA 
CACAAACTCA ACGTCCTGCA CCTACACCTC ACCGACGACC AAGGCTGGCG TATCGAAATC 
AAACGCTACC CCAAACTCAC TGCAATCGGC GCCGAACGCA TCCCACCGGG CGCCGGACGC 
CACGGCACCC CAGAACGCTA CGGCGGCTTC TACACCCAAG ATCAAATCCG CGAACTCGTT 
GCCTACGCCA CCGAACGACA GATCACCATC CTCCCCGAAA TCGACATGCC CGGCCATGCA 
CAAGCCGCCG TGGCAGCCTA CCCCGACATC ATCGGAGTCA CCAGCACCAC CCCACCCGTC 
AGCGTCGACT GGGGCGTCAA CCCCTACCTC TTCGGCACCA GCACACCCAG CCTGGACTTC 
ATCCGCAATG TACTCGACGA AGTACTCACC CTATTCCCCT CCCAGTACAT CCACATCGGC 
GGCGACGAAG CCGTTAAAGA TCAATGGGAA GCCTCACACA CCATCCGCGC CCAAATGCGC 
AAACTGGGCG TGAAAGACAC ACATGCCATG CAAGGCTGGC TCAACACACA ACTAGCCCAA 
TACCTCACAA CACATGACCG ACGCCTGATC GGCTGGGATG AAATCATCCA AAGTGGCCTA 
CCAGAGAGCG CCTCCGTGAT GTCATGGCGC GGCGTCGAAG GCGCCATTAC CGCCGCACAA 
CAAGGACACG ACGTCGTCCT CGCCCCCGCT GGCTGGATGT ACCTAGACAA CCTGCAAACC 
GAACGCAGCG ACGAACCAAA CGGCCGCCTC GCCACCCTGC CCCTCTCCCG CGTCTACACA 
CTGGACCCCG TCCCCAAAGA ACTGACCCCC GACCAAGCCA TCCACATCCT GGGCCTACAA 
AGCGCCCTGT GGAGCGAATA CATCCCCTCA CGCTGGCACA TCGACCACGC CCTATTCCCA 
CGCCTCGCCG CCGTCGCCGA AGTCGCCTGG TCCCCCATGA CCGCACGCAA CTGGGACAAC 
TTCCTCAAAC GCCTCCCCCC ACAACTACAC CGCTACCGCA CCCTGCACAT CGACTACAGC 
GACGGCGCAT TCGCCCCCGA CATCATGCTG CAACACCGCT CAGCCTACGT CCTTGCTGGC 
GAACCCCCTC ACATCACACT CAGCAACCAA ACCAACACCG GCCAAATTCA CTACACCACA 
AACGGCAACG AACCGACCCT ACATTCCCCC CGCTACACCG CCCCATTTCC CATCACCCTC 
CCCACCACAG TCAAAGCAGC CGTATTCACC GAAGACGGCC GCCCCCTGGC CGCCACCCGC 
AGCCGCACCT TCGACCACAA CACACTGCTG AGTGTGGACA CCCAAGAATT ACGCAACTGC 
TCCGACAAAG GACCACTGGG ATTACGCCTC CCCCTGCTAC CAGACATGCC CGACCCCAAC 
ACCCCCGTGT ACAACGTCGA CCTATTCCAC GCCTGCTGGA TCGTCCCCCA AATACGCCTC 
AACAACATAC AAGCCATCCA CATCGACGCC GCACGCCTAG CACGCAACTA CGGCCTGGCC 
CACGACCAAT CCAAAGTCAT TCAATATCCC AAACACACCG CACACGGCGA ACTGGAAATC 
CGCACCGACT GCAACAAAAA ACCACTGGCC GTGATCCCCC TCCCGCCCGG AGACACCATC 
GGCGAACCAT TCACCCTCGA CGCCCCATTA CCACCGAACA TCGGCGTCCA CGACCTGTGC 
CTACGCATCA CCGCCCCCAT CCACGGCCCA CTGTATGCCA TTGGTCGCGT CCAACTGATC 
CACGACACCC CCGCATCACC TCCGCCCCCC ACACACTGA

Protein sequence

MPPTPARPTQ EPPLLRALLT LCIAALSTTS FDTTASHHKK SQHPLPPRTA SGPPLPPLPL 
IPAPVQIQRG HGQIHIGPHT LISIPPNDTD AQHSATYLAT LLQHTRNLTL HIHTETTPTP 
DSIRLQRDPQ SPVTQTEGYT LQALPNQGMH ITARDGAGLF YGAITAWQLL TADSNQGPTE 
IPTVTIHDWP RFKWRGQLLD VARHFHDVDT VKHVIDAMAQ HKLNVLHLHL TDDQGWRIEI 
KRYPKLTAIG AERIPPGAGR HGTPERYGGF YTQDQIRELV AYATERQITI LPEIDMPGHA 
QAAVAAYPDI IGVTSTTPPV SVDWGVNPYL FGTSTPSLDF IRNVLDEVLT LFPSQYIHIG 
GDEAVKDQWE ASHTIRAQMR KLGVKDTHAM QGWLNTQLAQ YLTTHDRRLI GWDEIIQSGL 
PESASVMSWR GVEGAITAAQ QGHDVVLAPA GWMYLDNLQT ERSDEPNGRL ATLPLSRVYT 
LDPVPKELTP DQAIHILGLQ SALWSEYIPS RWHIDHALFP RLAAVAEVAW SPMTARNWDN 
FLKRLPPQLH RYRTLHIDYS DGAFAPDIML QHRSAYVLAG EPPHITLSNQ TNTGQIHYTT 
NGNEPTLHSP RYTAPFPITL PTTVKAAVFT EDGRPLAATR SRTFDHNTLL SVDTQELRNC 
SDKGPLGLRL PLLPDMPDPN TPVYNVDLFH ACWIVPQIRL NNIQAIHIDA ARLARNYGLA 
HDQSKVIQYP KHTAHGELEI RTDCNKKPLA VIPLPPGDTI GEPFTLDAPL PPNIGVHDLC 
LRITAPIHGP LYAIGRVQLI HDTPASPPPP TH