Gene Smal_1767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smal_1767
Symbol
ID	6475638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stenotrophomonas maltophilia R551-3
Kingdom	Bacteria
Replicon accession	NC_011071
Strand	+
Start bp	1977762
End bp	1978760
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	67%
IMG OID	642730949
Product	N(4)-(beta-N-acetylglucosaminyl)-L-asparaginase
Protein accession	YP_002028154
Protein GI	194365544
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1446] Asparaginase
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.250239
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGGATC GCAGGCAGTT CCTGCAGGCC GGTGCACTGG CCGCAGGCAT GGCGGCATTG 
CCGGGCGTGC AGGCACGCAC GCAGGGTGGG GCCAAGGTGG TTTCGACCTG GGACTTCGGC 
GTACCGGCCA ACCAGGCCGC ATGGAAGGTA CTGGCGCAGG GCGGCAGCGC GCTGGATGCG 
GTCGAAGCGG GCGCACGCTG GGCCGAGAGC GAGTTGTGCA ACCCCACCGT CGGCCATTGC 
GGCAATCCGG ATCGCGACGG CGTGCTGAGC TTGGACGCGA GCATCATGGA CGGCGATGGC 
CGTTGTGGTG CAGTGGCCGC GCTGGTCGAC ATCCTGCATC CGGTGTCGGT GGCCCGCAAA 
GTGATGGAGA ACAGCCCGCA CGTGCTGCTG GTGGGCGAGG GCGCGCAGCA GTTCGCGGTG 
CAGCAGGGTT TCGAGCGCAA GCACCTGCTG ACGCCGCAGG CTGAAGCCGC CTGGCACGAG 
TGGCTGAAGA CCGAGAAGTA CCAGCCGCAG ATCAATGCCG AGCGCCGCGG TATTCCCGGC 
AACAGCGACA ACCACGACAC CATCGGCATG CTGGCACTGG ATGCCAAGGG CCACCTGGCC 
GGTGCCTGCA CCACCAGCGG CATGGCCTGG AAACTGCATG GCCGCGTCGG CGACAGCCCG 
ATCATCGGTG CCGGCCTGTA CGTCGACAAC GACGTGGGTG CAGCCACTGC CTCGGGCGTG 
GGCGAGGAGA TGATCCGCAA TGCCGCCTCG TTCCTGGTGG TCGAGCTGAT GCGCCAGGGG 
CGCTCGCCGG CGCAGGCCTG CCGTGAAGCA ATTGACCGCG TGGTGCGCAA GCGCCCCGAA 
GCGAGCAAGA CACTGCAGGT CTGCTTCCTG GCCATGAACA AGCAGGGTGA GGTGGGCGCT 
TACGCGCTGC ATCGCGGTTT TGTCTACGCC GTGTGCGATG CGCAGCGCCA GGATGACCTG 
CGTGATTCGC CGTCGATCTA CACGAGCACC CAGACGTGA

Protein sequence

MVDRRQFLQA GALAAGMAAL PGVQARTQGG AKVVSTWDFG VPANQAAWKV LAQGGSALDA 
VEAGARWAES ELCNPTVGHC GNPDRDGVLS LDASIMDGDG RCGAVAALVD ILHPVSVARK 
VMENSPHVLL VGEGAQQFAV QQGFERKHLL TPQAEAAWHE WLKTEKYQPQ INAERRGIPG 
NSDNHDTIGM LALDAKGHLA GACTTSGMAW KLHGRVGDSP IIGAGLYVDN DVGAATASGV 
GEEMIRNAAS FLVVELMRQG RSPAQACREA IDRVVRKRPE ASKTLQVCFL AMNKQGEVGA 
YALHRGFVYA VCDAQRQDDL RDSPSIYTST QT