Gene SbBS512_E1631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1631
Symbol
ID	6269196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	1483961
End bp	1485253
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	50%
IMG OID	641725720
Product	PAP2 family protein
Protein accession	YP_001880219
Protein GI	187732315
COG category	[T] Signal transduction mechanisms
COG ID	[COG2453] Predicted protein-tyrosine phosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	0.832741
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTACAAG GCGCTGGCTG GTTATTGTTG CTGGCCCCGT TTTTTTTCTT CACCTATGGA 
TCTCTTAATC AGTTCACCGC GGTTCAGGAC CTTAACAGCC ATGATATCCC CAGTCAGGTA 
TTCGGTTGGG AAACGGCGAT CCCTTTTCTT CCCTGGACTA TTGTTCCTTA CTGGAGTCTG 
GATCTTTTAT ATGGATTTTC GCTGTTCGTT TGTAGCACGA CATTCGAACA GCGCCGACTT 
GTCCACCGGC TTATTCTGGC AACGGTAATG GCCTGCTGCG GTTTTTTGCT CTATCCGCTG 
AAGTTTAGTT TTATCCGTCC TGAAGTGAGT GGGGTGACGG GATGGCTATT TTCGCAACTT 
GAACTGTTTG ATCTGCCTTA TAACCAGTCT CCTTCGCTGC ATATTATTCT CTGCTGGCTA 
CTTTGGCGTC ACTTTCGTCA GCATCTGGCT GAGAGGTGGC GTAAAGTCTG TGGCGGATGG 
TTTTTACTCA TCGCTATTTC TACTCTGACG ACCTGGCAGC ATCATTTTAT TGATGTCATC 
ACAGGGCTGG CGGTAGGTAT GTTGATTGAC TGGATGGTGC CCGTCGATCG TCGTTGGAAT 
TATCAGAAAC CTGATCAACG TCGAATCAAA ATAGCACTGC CATATGTCGT AGGCGCGGGC 
TCGTGCATTG TGTTGATGGA GCTAATGGTG ATGATTCAGT TATGGTGGTC AGTCTGGTTA 
TGTTGGCCAG TATTATCGCT ACTCATTATT GGCCGTGGGT ACGGTGGGCT TGGCGCGATA 
ACAACAGGGA AAGATAGTCA GGGGAAACTC CCGCCCGCCG TTTACTGGCT GACATTGCCC 
TGGCGCATCG GGATGTGGCT GTCTATGCGT TGGTTTTGTC GTCGCCTGGA GCCGGTGAGC 
AAAATTACTG CTGGTGTTTA TTTAGGGGAG TTTCCACGAC ATATTCCGGC ACAGAATGCG 
GTTCTGGACG TCACCTTTGA ATTCCCTCGG GGACGAGCGA CAAAAGATCG ACTCTATTTC 
TGTGTACCGA TGCTGGATCT GGTGGTTCCG GAAGAGGGGG AGCTCCGACA GGCCGTGGCG 
ATGCTGGAAA CATTACGCGA AGAGCAAGGC AGCGTTCTGG TCCATTGCGC GTTGGGATTA 
TCGCGCAGTG CGCTGGTAGT GGCGGCATGG TTGTTATGTT ACGGACACTG TAAAACCGTT 
GATGAAGCGA TTAGTTATAT TCGAGCCAGA CGTTCGCATA TTGTGCTTAA GGAAGATCAC 
AAAGCGATGC TGAAATTATG GGAAAACAGG TAA

Protein sequence

MLQGAGWLLL LAPFFFFTYG SLNQFTAVQD LNSHDIPSQV FGWETAIPFL PWTIVPYWSL 
DLLYGFSLFV CSTTFEQRRL VHRLILATVM ACCGFLLYPL KFSFIRPEVS GVTGWLFSQL 
ELFDLPYNQS PSLHIILCWL LWRHFRQHLA ERWRKVCGGW FLLIAISTLT TWQHHFIDVI 
TGLAVGMLID WMVPVDRRWN YQKPDQRRIK IALPYVVGAG SCIVLMELMV MIQLWWSVWL 
CWPVLSLLII GRGYGGLGAI TTGKDSQGKL PPAVYWLTLP WRIGMWLSMR WFCRRLEPVS 
KITAGVYLGE FPRHIPAQNA VLDVTFEFPR GRATKDRLYF CVPMLDLVVP EEGELRQAVA 
MLETLREEQG SVLVHCALGL SRSALVVAAW LLCYGHCKTV DEAISYIRAR RSHIVLKEDH 
KAMLKLWENR