Gene SbBS512_E3753 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3753
Symbol
ID	6273177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3477778
End bp	3478863
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	57%
IMG OID	641727616
Product	hypothetical protein
Protein accession	YP_001882051
Protein GI	187730904
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGACGT TTCCTCTGCA AAGCCTGACG CTTATTGAGG CGCAGCAAAA GCAGTTTGCG 
CTGGTGGACA CGATTTGCCG TCACTTTCCC GGCGCGGAGT TTCTAACCAG CGGTGATTTG 
GGCTTAACGC CGGGGCTGAA TCAACCGCGT ATTACCCAAC GGGTGGAGCA GGTGCTGGCT 
GATGCATTTC ACGCACAGGC TGCGGCGCTG GTGCAGGGCG CGGGGACTGG CGCGATTCGC 
GCCGGGCTGG CAGCTTTGCT CAAACCGGGG CAGCGTCTTC TGGTGCATGA CGCGCCTGTT 
TACCCGACGA CACGGGTTAT TGTTGAGCAG ATGGGGCTGA CGCTTATTAC TGTTGATTTC 
AATGACCTGT CGGCACTGAA GCAGGTCGTC GACGAGCAAC AACCGGATGC GGCGCTGGTG 
CAGCATACGC GCCAGCAGCC GCAGGACAGC TACGTGCTGG CAGATGTGCT GGCAACGTTG 
CGCGCGGCAG GTGTTCCAGC GTTAACCGAT GACAACTATG CGGTGATGAA GGTGGCGCGA 
ATCGGCTGTG AATGCGGCGC GAATGTCTCG ACATTTTCCT GCTTCAAGCT ATTTGGGCCA 
GAGGGTGTTG GTGCAGTGGT CGGCGATGCT GATGTTATCA ACCGTATTCG CGCCACGCTT 
TACTCCGGCG GTAGCCAGAT CCAGGGCGCA CAGGCGCTGG AAGTATTGCG TTGTCTGGTG 
TTTGCGCCAG TGATGCACGC GGTGCAGGCA GGGGTATCTG AACGGTTGCT GGCTTTGCTT 
AACGGTGGTG CGGTGCCGGA AGTGAAAAGC GCGGTGATTG CTAATGCGCA GTCGAAGGTG 
TTGATTGTCG AGTTTCATCA GCCGATTGCC GCCAGAGTGC TGGAAGAGGC GCAAAAGCGC 
GGTGCCTTGC CTTACCCGGT GGGTGCAGAG TCGAAATATG AAATCCCGCC GCTCTTTTAT 
CGCCTTTCCG GAACGTTTCG CCAGGCGAAT CCACAATCAG AACATTGTGC GATTCGCATT 
AACCCGAATC GCAGCGGTGA AGAGACGGTG CTGCGGATTT TGCGTGAGAG TATTGCCAGT 
ATTTAA

Protein sequence

MKTFPLQSLT LIEAQQKQFA LVDTICRHFP GAEFLTSGDL GLTPGLNQPR ITQRVEQVLA 
DAFHAQAAAL VQGAGTGAIR AGLAALLKPG QRLLVHDAPV YPTTRVIVEQ MGLTLITVDF 
NDLSALKQVV DEQQPDAALV QHTRQQPQDS YVLADVLATL RAAGVPALTD DNYAVMKVAR 
IGCECGANVS TFSCFKLFGP EGVGAVVGDA DVINRIRATL YSGGSQIQGA QALEVLRCLV 
FAPVMHAVQA GVSERLLALL NGGAVPEVKS AVIANAQSKV LIVEFHQPIA ARVLEEAQKR 
GALPYPVGAE SKYEIPPLFY RLSGTFRQAN PQSEHCAIRI NPNRSGEETV LRILRESIAS 
I