Gene SbBS512_E4899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4899
Symbol	mdoB
ID	6270909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	4570802
End bp	4573093
Gene Length	2292 bp
Protein Length	763 aa
Translation table	11
GC content	52%
IMG OID	641728629
Product	phosphoglycerol transferase I
Protein accession	YP_001883023
Protein GI	187731139
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1368] Phosphoglycerol transferase and related proteins, alkaline phosphatase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.309002
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTCAGAAC TACTCTCTTT CGCCCTTTTT CTCGCCTCTG TGCTGATTTA CGCATGGAAA 
GCGGGACGTA ACACCTGGTG GTTTGCAGCC ACATTAACGG TGCTGGGGCT ATTTGTCGTT 
TTAAATATCA CCCTGTTTGC CAGCGACTAT TTTACTGGCG ATGGTATTAA CGACGCGGTT 
CTCTATACCT TAACCAACAG CCTGACCGGT GCTGGCGTCA GCAAATACAT CCTGCCGGGT 
ATCGGCATTG TGCTGGGGCT GACAGCGGTG TTCGGTGCGC TGGGCTGGAT CCTGCGCCAT 
CGTCGCCATC ATCCGCACCA TTTTGGTTAC AGCCTGCTGG CGCTCTTACT GGCGCTGGGT 
TCGGTGGACG CCAGCCCGGC ATTTCGTCAG ATAACGGAAC TGGTGAAATC CCAGTCACGC 
GATGGCGACC CGGACTTTGC GGCTTATTAT AAAGAGCCGT CGAAAACTAT CCCTGACCCG 
AAACTCAACC TGGTTTATAT CTACGGCGAA AGTCTCGAGC GGACCTATTT TGATAACGAA 
GCTTTCCCGG ATCTCACGCC TGAACTGGGC GCGTTGAAAA ATGAAGGCCT GGATTTCAGC 
CACACGCAGC AGCTGCCAGG AACGGATTAC ACGATTGCGG GCATGGTGGC TTCTCAGTGC 
GGCATACCGC TGTTTGCCCC CTTTGAAGGC AACGCCTCCG CCTCTGTCTC CAGCTTCTTC 
CCGCAGAACA TCTGTCTGGG CGATATCCTG AAAAACTCGG GTTATCAGAA CTATTTCGTG 
CAGGGCGCGA ATCTGCGTTT TGCCGGTAAA GATGTGTTCC TGAAGTCGCA TGGCTTCGAC 
CACTTATACG GCTCAGAAGA GCTGAAAAGC GTGGTGGCCG ACCCGCACTA TCGCAACGAC 
TGGGGATTCT ACGACGATAC CGTTCTCGAT GAAGCGTGGA AAAAGTTTGA AGAGCTTTCC 
CGCTCAGGTC AGCGATTCTC ACTGTTTACC CTGACAGTCG ATACCCATCA CCCGGATGGT 
TTTATCTCGC GTACCTGTAA CCGCAAAAAA TATGATTTTG ACGGTAAGCC AAACCAGTCA 
TTCAGCGCGG TAAGTTGCAG CCAGGAGAAT ATCGCGGCGT TTATCAACAA AATCAAAGCG 
TCACCGTGGT TTAAAGATAC CGTCATCGTC GTCTCTTCTG ACCATTTAGC GATGAACAAC 
ACGGCGTGGA AATACCTCAA TAAGCAGGAT CGCAATAACC TGTTTTTTGT CATTCGTGGC 
GACAAGCCGC AGCAAGAGAC GCTGGCAGTG AAGCGTAACA CGATGGATAA CGGCGCGACG 
GTGCTGGACA TTCTCGGTGG CGATAACTAT CTCGGACTTG GTCGTAGCAG TTTATCCGGG 
CAGTCGATGT CGGAAATCTT CCTCAATATC AAAGAGAAAA CATTGGCGTG GAAGCCGGAT 
ATCATCCGCC TGTGGAAATT CCCTAAAGAG ATGAAAGAGT TCACCATCGA CCAGCAGAAA 
AACATGATTG CCTTCTCGGG TAGCCATTTC CGTTTGCCGC TGCTGTTGCG GGTTTCAGAC 
AAACGCGTGG AACCGCTGCC GGAAAGCGAA TACTCAGCAC CGCTGCGTTT CCAGCTGGCC 
GATTTCGCTC CACGCGACAA TTTCGTCTGG GTTGACCGTT GCTATAAGAT GGCACAACTC 
TGGGCTCCGG AACTGGCACT CTCCACCGAC TGGTGTGTCT CGCAAGGGCA GCTTGGCGGT 
CAGCAAATTG TTCAGCATGT TGACAAAACA ACATGGCAGG GCAAAACGGC ATTTAAAGAT 
ACGGTCATCG ACATGGCGCG TTATAAAGGC AATGTCGATA CGCTGAAAAT TGTTGATAAC 
GATATTCGCT ACAAAGCCGA CAGTTTCATC TTCAACGTCG CCGGTGCGCC AGAAGAGGTG 
AAACAGTTTA GTGGGATTTC CCGTCCAGAG TCGTGGGGCC GCTGGTCCAA CGCGCAGCTG 
GGCGATGAAG TAAAAATCGA GTACAAGCAT CCGCTGCCAA AGAAATTTGA CCTGGTGATT 
ACCGCCAAAG CATACGGCAA TAACGCCAGC CGTCCTATTC CGGTACGCGT AGGCAATGAA 
GAACAAACCC TTGTGCTGGG CAATGAAGTG ACCACCACCA CACTGCATTT CGATAACCCA 
ACCGATGCCG ACACACTGGT AATTGTGCCG CCGGAACCTG TCTCAACCAA CGAAGGGAAT 
ATCCTCGGAC ACTCGCCGCG TAAGCTCGGG ATCGGCATGG TGGAAATTAA AGTGGTGGAA 
CGTGAAGGAT AA

Protein sequence

MSELLSFALF LASVLIYAWK AGRNTWWFAA TLTVLGLFVV LNITLFASDY FTGDGINDAV 
LYTLTNSLTG AGVSKYILPG IGIVLGLTAV FGALGWILRH RRHHPHHFGY SLLALLLALG 
SVDASPAFRQ ITELVKSQSR DGDPDFAAYY KEPSKTIPDP KLNLVYIYGE SLERTYFDNE 
AFPDLTPELG ALKNEGLDFS HTQQLPGTDY TIAGMVASQC GIPLFAPFEG NASASVSSFF 
PQNICLGDIL KNSGYQNYFV QGANLRFAGK DVFLKSHGFD HLYGSEELKS VVADPHYRND 
WGFYDDTVLD EAWKKFEELS RSGQRFSLFT LTVDTHHPDG FISRTCNRKK YDFDGKPNQS 
FSAVSCSQEN IAAFINKIKA SPWFKDTVIV VSSDHLAMNN TAWKYLNKQD RNNLFFVIRG 
DKPQQETLAV KRNTMDNGAT VLDILGGDNY LGLGRSSLSG QSMSEIFLNI KEKTLAWKPD 
IIRLWKFPKE MKEFTIDQQK NMIAFSGSHF RLPLLLRVSD KRVEPLPESE YSAPLRFQLA 
DFAPRDNFVW VDRCYKMAQL WAPELALSTD WCVSQGQLGG QQIVQHVDKT TWQGKTAFKD 
TVIDMARYKG NVDTLKIVDN DIRYKADSFI FNVAGAPEEV KQFSGISRPE SWGRWSNAQL 
GDEVKIEYKH PLPKKFDLVI TAKAYGNNAS RPIPVRVGNE EQTLVLGNEV TTTTLHFDNP 
TDADTLVIVP PEPVSTNEGN ILGHSPRKLG IGMVEIKVVE REG