Gene SbBS512_E2740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2740
Symbol
ID	6269789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	2542720
End bp	2543865
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	45%
IMG OID	641726701
Product	hypothetical protein
Protein accession	YP_001881180
Protein GI	187732857
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.382378
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAATA ATGAAAGCAA AGGGCCGTTT GAAGGCTTAT TAGTTATCGA TATGACACAT 
GTCCTTAATG GACCTTTCGG AACTCAACTT CTTTGTAATA TGGGCGCAAG GGTAATTAAA 
GTTGAGCCGC CGGGTCATGG TGATGATACC CGCACATTTG GTCCCTATGT GGATGGACAG 
TCACTCTATT ACAGTTTTAT TAATCATGGC AAAGAGAGTG TGGTTCTTGA TTTAAAGAAT 
GATTACGATA AAAGTATATT TATAAATATG CTCAAACAAG CTGATGTATT AGCTGAGAAT 
TTTCGCCCAG GTACAATGGA AAAACTGGGG TTTTCATGGG AAACGCTTCA AGAAATCAAC 
CCGAGCCTCA TATATGCTTC ATCGTCAGGT TTCGGACATA CCGGTCCGCT AAAAGATGCT 
CCTGCCTACG ATACCATCAT TCAGGCAATG AGCGGGATAA TGATGGAAAC AGGATATCCT 
GATGCTCCGC CAGTGCGCGT TGGTACATCT CTTGCGGATC TATGCGGCGG TGTCTATTTA 
TTCAGCGGAA TAGTGAGTGC ACTTTATGGC CGCGAAAAGA GCCAGAGAGG GGCGCATGTC 
GATATAGCGA TGTTTGATGC CACGCTGAGT TTTCTGGAGC ATGGTCTGAT GGCATATATC 
GCGACAGGGA AGTCACCACA ACGTCTGGGA AATCGCCATC CCTACATGGC ACCTTTTGAT 
GTTTTCAATA CTCAGGATAA GCCGATTACG ATTTGTTGTG GTAATGACAA GCTTTTTTCT 
GCGTTATGCC AGGCACTGGA GCTTACGGAA CTGGTTAATG ATCCCCGATT TAGCAGCAAT 
ATTTTACGCG TACAAAACCA GGCTATTCTT AAACAATATA TTGAGCGGAC GTTAAAAACG 
CAGGCAGCTG AAGTTTGGTT AGCCAGAATA CATGAAGTTG GTGTACCCGT CGCGCCGTTA 
TTAAGTGTGG CTGAGGCCAT TAAATTGCCA CAAACTCAGG CGAGAAATAT GTTGATTGAA 
GCCGGGGGAA TAATGATGCC GGGTAATCCG ATAAAAATCA GCGGCTGCGC GGACCCGCAT 
GTTATGCCGG GAGCGGCAAC GCTCGACCAG CATGGGGAAC AAATTCGCCA GGAGTTCTCA 
TCATAA

Protein sequence

MTNNESKGPF EGLLVIDMTH VLNGPFGTQL LCNMGARVIK VEPPGHGDDT RTFGPYVDGQ 
SLYYSFINHG KESVVLDLKN DYDKSIFINM LKQADVLAEN FRPGTMEKLG FSWETLQEIN 
PSLIYASSSG FGHTGPLKDA PAYDTIIQAM SGIMMETGYP DAPPVRVGTS LADLCGGVYL 
FSGIVSALYG REKSQRGAHV DIAMFDATLS FLEHGLMAYI ATGKSPQRLG NRHPYMAPFD 
VFNTQDKPIT ICCGNDKLFS ALCQALELTE LVNDPRFSSN ILRVQNQAIL KQYIERTLKT 
QAAEVWLARI HEVGVPVAPL LSVAEAIKLP QTQARNMLIE AGGIMMPGNP IKISGCADPH 
VMPGAATLDQ HGEQIRQEFS S