Gene SbBS512_E2666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2666
Symbol
ID	6271853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	2468113
End bp	2469330
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	50%
IMG OID	641726631
Product	aminotransferase AlaT
Protein accession	YP_001881111
Protein GI	187732491
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.180875
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCCCA TTGAAAAATC CAGCAAATTA GAGAATGTCT GTTATGACAT CCGTGGTCCG 
GTGCTGAAAG AAGCAAAACG CCTGGAAGAA GAAGGTAACA AGGTACTGAA ACTGAACATC 
GGCAACCCAG CCCCGTTCGG TTTTGACGCG CCAGATGAAA TCCTCGTTGA CGTGATACGC 
AACCTGCCTA CCGCTCAAGG GTATTGCGAT TCCAAAGGTC TTTACTCCGC GCGTAAAGCC 
ATCATGCAGC ACTACCAGGC TCGTGGCATG CGTGATGTTA CCGTGGAAGA TATTTACATC 
GGCAATGGTG TATCGGAGCT TATCGTTCAG GCAATGCAGG CATTGCTGAA CAGCGGGGAC 
GAAATGTTGG TTCCTGCACC AGATTACCCA CTATGGACCG CGGCGGTTTC GCTTTCCAGC 
GGTAAAGCGG TGCATTATCT TTGCGATGAA TCCTCTGACT GGTTCCCGGA CCTCGATGAT 
ATTCGCGCTA AAATTACGCC TCGTACGCGT GGGATCGTTA TTATCAACCC AAATAACCCA 
ACCGGCGCGG TATATTCCAA AGAGCTTTTA ATGGAGATTG TGGAGATTGC ACGTCAGCAT 
AATCTCATTA TCTTCGCCGA TGAAATTTAT GACAAAATTC TTTACGACGA CGCTGAGCAT 
CACTCAATTG CGCCGCTGGC ACCTGACCTG CTGACCATTA CCTTTAACGG ACTGTCGAAA 
ACGTACCGCG TTGCAGGCTT CCGTCAGGGG TGGATGGTGT TGAACGGGCC GAAAAAACAC 
GCCAAAGGCT ACATCGAAGG TCTGGAAATG CTGGCTTCAA TGCGCCTGTG TGCTAACGTT 
CCTGCGCAAC ACGCCATTCA GACCGCGCTG GGTGGTTATC AGAGCATCAG TGAATTTATT 
ACCCCTGGAG GTCGTCTTTA TGAGCAGCGT AACCGCGCGT GGGAACTGAT CAACGATATT 
CCGGGCGTTT CCTGCGTGAA ACCTCGTGGT GCGCTGTATA TGTTCCCGAA AATCGACGCC 
AAACGCTTTA ACATTCACGA CGATCAGAAA ATGGTGCTGG ATTTCCTGTT GCAGGAAAAA 
GTTCTGTTGG TGCAAGGGAC GGCATTCAAC TGGCCGTGGC CGGATCACTT CCGCATTGTC 
ACGCTACCGC GTGTCGATGA TATCGAGCTG TCTTTGAGCA AGTTCGCGCG TTTCCTTTCT 
GGTTATCATC AGCTGTAA

Protein sequence

MSPIEKSSKL ENVCYDIRGP VLKEAKRLEE EGNKVLKLNI GNPAPFGFDA PDEILVDVIR 
NLPTAQGYCD SKGLYSARKA IMQHYQARGM RDVTVEDIYI GNGVSELIVQ AMQALLNSGD 
EMLVPAPDYP LWTAAVSLSS GKAVHYLCDE SSDWFPDLDD IRAKITPRTR GIVIINPNNP 
TGAVYSKELL MEIVEIARQH NLIIFADEIY DKILYDDAEH HSIAPLAPDL LTITFNGLSK 
TYRVAGFRQG WMVLNGPKKH AKGYIEGLEM LASMRLCANV PAQHAIQTAL GGYQSISEFI 
TPGGRLYEQR NRAWELINDI PGVSCVKPRG ALYMFPKIDA KRFNIHDDQK MVLDFLLQEK 
VLLVQGTAFN WPWPDHFRIV TLPRVDDIEL SLSKFARFLS GYHQL