Gene SbBS512_E4761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4761
Symbol
ID	6271458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	4443183
End bp	4444598
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	55%
IMG OID	641728516
Product	aminotransferase, classes I and II superfamily
Protein accession	YP_001882911
Protein GI	187732129
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATAACAG ATGTCTGGAA ATATAGGGGC AAATCCACCG AGCGGATTGA GCAAGGGCTG 
TATCGTCACG GGGATAAATT GCCGTCGGTG CGCAGCTTAA GTCAGGAGCA CGGCGTCAGC 
ATCAGCACCG TGCAGCAGGC GTACCAGACG CTGGAGACGA TGAAGCTCAT CACTCCGCAG 
CCGCGTTCGG GTTATTTTGT CGCACAACGT AAAGCCCAGC CGCCTGTACC GCCGATGACG 
CGTCCGGTGC AGCGCCCGGT GGAAATTACC CAGTGGGATC AGGTGCTGGA TATGCTGGAG 
GCGCATAGCG ACAATTCCAT TGTTCCGTTA AGCAAAAGCA CGCCGGATGT CGAAACGCCC 
AGCCTGAAAC CACTCTGGCG TGAGCTAAGC CGGGTGGTGC AGCATAATCT ACAAACCGTG 
CTCGGTTATG ACTTGTTAGC CGGTCAGCGA GTGTTGCGGG AGCAGATTGC CCGCCAGATG 
CTCGACAGCG GCTCGGTGGT CACCGCCGAT GACATCATCA TCACCAGCGG CTGCCATAAC 
TCGATGTCGC TGGCGTTAAT GGCGGTGTGT AAACCGGGCG ATATTGTCGC GGTCGAATCT 
CCCTGTTATT ACGGTTCGAT GCAGATGCTG CGAGGCATGG GCGTGAAAGT GATTGAAATC 
CCAACCGATC CAGAAACTGG CATCAGCGTT GAAGCACTGG AACTGGCGCT GGAACAGTGG 
CCGATTAAAG GCATCATTCT GGTGCCAAAC TGTAATAATC CGCTGGGATT TATTATGCCG 
GACGCACGCA AACGGGCCGT TCTCTCTCTC GCTCAGCGTC ATGATATTGT GATTTTTGAA 
GATGATGTCT ACGGCGAACT GGCAACGGAG TATCCGCGCC CGCGGACCAT CCATTCATGG 
GATATCGACG GGCGAGTGCT GTTGTGCAGC TCGTTCAGTA AAAGTATTGC TCCAGGCCTG 
CGCGTGGGTT GGGTCGCACC GGGGCGTTAT CACGATAAAC TGATGCATAT GAAATACGCC 
ATCAGCAGCT TTAATGTGCC GTCCACGCAA ATGGCGGCGG CAACGTTTGT GTTGGAAGGC 
CACTATCATC GCCATATCCG GCGGATGCGG CAGACTTATC AGCGCAATCT GGCGCTTTAT 
ACCTGCTGGA TACGGGAATA TTTTCCCTAC GAAATCTGTA TTACGCGCCC GAAAGGCGGA 
TTTTTACTGT GGATCGAATT GCCTGAACAG GTCGATATGG TCTGCGTCGC GCGGCAGCTG 
TACCGCATGA AAATCCAGGT GGCGGCAGGC TCGATTTTCT CGGCTTCCGG CAAATACCGT 
AATTGTCTGC GCATCAACTG CGCTTTGCCG CTCAGCGAAA CCTATCGCGA AGCACTAAAG 
CAAATTGGCG ATGCCGTGTA TCGGGCAATG GAATAA

Protein sequence

MITDVWKYRG KSTERIEQGL YRHGDKLPSV RSLSQEHGVS ISTVQQAYQT LETMKLITPQ 
PRSGYFVAQR KAQPPVPPMT RPVQRPVEIT QWDQVLDMLE AHSDNSIVPL SKSTPDVETP 
SLKPLWRELS RVVQHNLQTV LGYDLLAGQR VLREQIARQM LDSGSVVTAD DIIITSGCHN 
SMSLALMAVC KPGDIVAVES PCYYGSMQML RGMGVKVIEI PTDPETGISV EALELALEQW 
PIKGIILVPN CNNPLGFIMP DARKRAVLSL AQRHDIVIFE DDVYGELATE YPRPRTIHSW 
DIDGRVLLCS SFSKSIAPGL RVGWVAPGRY HDKLMHMKYA ISSFNVPSTQ MAAATFVLEG 
HYHRHIRRMR QTYQRNLALY TCWIREYFPY EICITRPKGG FLLWIELPEQ VDMVCVARQL 
YRMKIQVAAG SIFSASGKYR NCLRINCALP LSETYREALK QIGDAVYRAM E