Gene Smal_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smal_2021
Symbol
ID	6476199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stenotrophomonas maltophilia R551-3
Kingdom	Bacteria
Replicon accession	NC_011071
Strand	-
Start bp	2263683
End bp	2264873
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	59%
IMG OID	642731203
Product	transcriptional regulator, AraC family
Protein accession	YP_002028408
Protein GI	194365798
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.104034
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCGCCA CGTTGAAACA GGTCCCCTGG CGGCCCGACT ATGTGGGCGT CGCACTACCT 
TTCGAATACG TGATGGCCCC TATCCCCAAG AATTTGCCGG CATTCAAGGA CTGGCCTGTC 
GCCGGCGAGG ATCCCGCGCT GGATGCTGCC GGTCTCCAGG CTTCTGAAGA TCCAAACGCC 
GCAAGCGAAT CGCAGATTGC CGAGATAGTG CCTACCGGGG CGAGGGCAAT CCTCGGCTTG 
GTCGAGGACC GGGGGTTCTC TCCGGAAGAG CTATGCCGCG GGCTCGGCTT CACTTATCGC 
GATCTATCAA TGAGGGACGT GAGGCTGTCC TACCGCCAGA TGCGCCAGTT GTTCATGCGG 
GCTGAGCGCT TGCTGGGCGA ACCTGCGCTG GGCCTGGCAC TGGGAGCCAG ACAGACGCCC 
ATTTCTTGGG GCGTACCCGG ATTGGCAATG CTCACCTGCG AGACCTACGG CGATGCACTG 
ACGTACGGCC TCACCCATCA GCAAGCCATC GGCTCGATGC TGATCCACAC GGTGGAGGAG 
GTGGGAAGGG AAGTGAGGAT GGAAGTCCGG TTCAAACGAT TCGACATTCA ACTGGAGTCG 
GTGCTGGTCG AGGACGCGTT CGCCGGATTC GTTGCGGTCA GCAGATACGT GATTGGACCA 
TCATTCGCGC CACTCAGGGT TGATTTCTCA CTCCCCAAGC CCTCTGATCC TGAAGTCTAT 
CGACGATTCT TCCAGTGCCC TGTCCGCTTC GATGCTGGCG TCAATCGCCT GACCATAGAC 
TCACATTGGC TGAGCGCGCG CTTGCCCGGT TTCGATCGGG TCAATTCAAG AATTGTCCGA 
GAGCAGTTGG ATTCACTTCT TCCAACGCGA GGGGGCCGCA ATGAGATTGT TGAATCCCTG 
TCGAGCCACC TTCGATGTGA TATCGAATCA ACGACCAAGC AGAGCGAACT TGCGAGCCTG 
ATCAATGTCA GTGAAAGAAC GCTCCGCCGC CGCCTGAGCC GCCAGGATTC CAGTTATAGG 
GAGATTCGGG ACGAAGCGAG GTATGAGCGC GCCCGCGATC TCCTGCTGAA CTCAGAGTTG 
AGCATCGCCG AAATTGCAGA CGCGGTTGGA TATTCCGACG CCCGTGCATT CCGCCGCGCA 
TTCAAGCGTT GGGCGGGTTG CCTGCCAACC GAGTTCCGGG AATCCAGGTA G

Protein sequence

MSATLKQVPW RPDYVGVALP FEYVMAPIPK NLPAFKDWPV AGEDPALDAA GLQASEDPNA 
ASESQIAEIV PTGARAILGL VEDRGFSPEE LCRGLGFTYR DLSMRDVRLS YRQMRQLFMR 
AERLLGEPAL GLALGARQTP ISWGVPGLAM LTCETYGDAL TYGLTHQQAI GSMLIHTVEE 
VGREVRMEVR FKRFDIQLES VLVEDAFAGF VAVSRYVIGP SFAPLRVDFS LPKPSDPEVY 
RRFFQCPVRF DAGVNRLTID SHWLSARLPG FDRVNSRIVR EQLDSLLPTR GGRNEIVESL 
SSHLRCDIES TTKQSELASL INVSERTLRR RLSRQDSSYR EIRDEARYER ARDLLLNSEL 
SIAEIADAVG YSDARAFRRA FKRWAGCLPT EFRESR