Gene SbBS512_A0114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_A0114
Symbol
ID	6273466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010660
Strand	-
Start bp	71426
End bp	72700
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	45%
IMG OID	641728761
Product	hypothetical protein
Protein accession	YP_001883152
Protein GI	187734427
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	118
Plasmid unclonability p-value	0.715385
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATATTT GGCGGGGACA TTCGTTTCTG ATGACAATTT CCGCCAGGTT CAGACAATAC 
GTTTTCTCTC TTATGTCAAT TTTATTGCAG GAACGAAAAA TGAATATTTT CACTTTATCC 
AAAGCACCGC TATACTTGTT AATTTCACTA TTTTTACCCA CGATGGCCAT GGCTATCGAT 
CCACCTGAAC GCGAACTTTC GCGATTTGCC CTGAAAACGA ATTACCTTCA GTCCCCTGAT 
GAAGGCGTCT ATGAACTGGC GTTTGATAAT GCCAGTAAAA AGGTGTTTGC AGCAGTCACC 
GATCGTGTAA ATCGTGAAGC CAATAAAGGC TATCTGTATT CGTTTAATTC AGATTCGCTG 
AAAGTCGAAA ATAAATACAC GATGCCATAC CGGGCATTTT CGCTGGCGAT AAATCAGGAT 
AAACATCAGC TCTATATCGG ACACACCCAG TCAGCGTCCC TGCGTATCAG TATGTTTGAC 
ACCCCAACCG GTAAACTGGT AAGAACCAGC GACAGGTTAA GTTTTAAAGC GGCAAACGCT 
GCAGATTCGC GTTTTGAGCA TTTGCGCCAT ATGGTTTACA GCCAGGATTC CGATACCCTG 
TTTGTGAGTT ATAGCAATAT GCTGAAAACG GCCGAGGGCA TGAAGCCTCT GCATAAGCTG 
TTAATGCTCG ACGGGACGAC GCTTGCCTTA AAAGGCGAGG TTAAGGATGC TTACAAAGGT 
ACAGCGTATG GTCTGACGAT GGATGAAAAA ACACAGAAAA TCTACGTTGG CGGAAGAGAT 
TACATCAACG AAATTGATGC GAAAAATCAG ACGCTGCTGC GTACCATCCC GTTGAAAGAT 
CCGAGACCAC AAATCACAAG TGTGCAGAAT CTGGCGGTGG ACTCCGCTTC TGACCGTGCC 
TTTGTGGTGG TATTCGACCA TGACGATCGT TCCGGTACAA AAGATGGCCT CTATATTTTT 
GACTTACGCG ACGGTAAACA GCTTGGCTAT GTGCACACAG GAGCCGGAGC TAACGCGGTG 
AAATACAATC CGAAATATAA CGAACTGTAT GTCACCAACT TCACTAGCGG CACCATCAGC 
GTAGTGGATG CCACCAAATA CAGCATCACC CGTGAATTTA ACATGCCGGT CTACCCAAAC 
CAGATGGTGT TGTCGGACGA TATGGATACC CTTTACATTG GCATCAAAGA AGGCTTTAAC 
CGCGATTGGG ATCCTGATGT GTTTGTGGAA GGAGCTAAAG AACGTATTCT GAGCATTGAT 
TTGAAAAAGT CGTGA

Protein sequence

MDIWRGHSFL MTISARFRQY VFSLMSILLQ ERKMNIFTLS KAPLYLLISL FLPTMAMAID 
PPERELSRFA LKTNYLQSPD EGVYELAFDN ASKKVFAAVT DRVNREANKG YLYSFNSDSL 
KVENKYTMPY RAFSLAINQD KHQLYIGHTQ SASLRISMFD TPTGKLVRTS DRLSFKAANA 
ADSRFEHLRH MVYSQDSDTL FVSYSNMLKT AEGMKPLHKL LMLDGTTLAL KGEVKDAYKG 
TAYGLTMDEK TQKIYVGGRD YINEIDAKNQ TLLRTIPLKD PRPQITSVQN LAVDSASDRA 
FVVVFDHDDR SGTKDGLYIF DLRDGKQLGY VHTGAGANAV KYNPKYNELY VTNFTSGTIS 
VVDATKYSIT REFNMPVYPN QMVLSDDMDT LYIGIKEGFN RDWDPDVFVE GAKERILSID 
LKKS