Gene SbBS512_E0421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E0421
Symbol
ID	6270729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	411406
End bp	412698
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	53%
IMG OID	641724649
Product	amino acid permease family protein
Protein accession	YP_001879198
Protein GI	187732317
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1113] Gamma-aminobutyrate permease and related permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAACA CGGAAGGTAA TAACGGTAAC AAACCCCTCG GTCTATGGAA TGTCGTTTCC 
ATCGGTATTG GGGCAATGGT GGGGGCGGGG ATCTTCGCGC TGCTGGGGCA GGCTGCGTTG 
CTAATGGAAG CCTCGACCTG GGTCGCCTTT GCTTTTGGCG GTATTGTGGC GATGTTTTCC 
GGTTATGCCT ATGCGCGTCT GGGGGCGAGC TATCCCAGTA ATGGCGGCAT TATCGACTTC 
TTTCGTCGCG GATTAGGCAA CGGCGTCTTT TCGCTGGCGC TCTCGTTACT GTACCTGTTG 
ACGCTGGCGG TGAGCATCGC CATGGTCGCC CATGCTTTTG GCGCTTATGC CGTGCAGTTT 
TTGCATGAAG GCAGCCAGGA GGAGCACCTT ATTTTGCTCT ACGCGTTGGG GAGCATTGCG 
GTGATGACGC TTTTCAACTC CTTAAGCAAC CATGCGGTAG GGCGGCTGGA AGTGATCCTC 
GTCGGCATTA AAATGATGAT CCTGTTATTG CTGATTATTG CCGGTGTCTG GTCGCTGCAA 
CCAGCGCATA TTTCCGTCTC TGCGCCCCCC AGCTCCGGTG CGTTCTTCTC CTGTATTGGG 
ATAACTTTCC TTGCCTATGC GGGCTTTGGC ATGATGGCGA ACGCGGCGGA TAAAGTGAAA 
GATCCGCAGG TCATTATGCC ACGGGCGTTT CTGGTGGCGA TTGGCGTTAC CACGTTGCTT 
TATATCTCGC TGGCACTGGT TTTGCTTAGC GATGTATCGG CATTAGAGTT AGAAAAATAT 
GCCGATACCG CCGTAGCGCA GGCTGCTTTT CCGCTGCTCG GACATGTGGG TTATGTGATC 
GTCGTCATCG GCGCTTTACT GGCGACGGCT TCAGCCATTA ACGCGAACCT GTTCGCCGTG 
TTTAACATCA TGGACAACAT GGGCAGCGAA CGCGAACTGC CGAAGCTAAT GAATAAATCC 
CTGTGGCGGC AGAGTACCTG GGGCAACATC ATTGTCGTGG TGTTGATTAT GCTGATGACG 
GCGGCACTGA ATTTAGGCTC ACTCGCCAGC GTTGCCAGCG CCACCTTTTT GATTTGCTAC 
CTGGCGGTGT TTGTGGTGGC GATCCGCCTG CGTCATGATA TTCACGCCTC GTTGCCGATT 
CTTATCGTTG GTACGTTGGT GATGTTGTTG GTGATCGTTG GCTTTATCTA CAGTCTGTGG 
TCCCAGGGTA GCCGTGCGTT GATATGGATT ATTGGCTCAC TCTTACTCAG CCTTATTGTG 
GCAATGGTCA TGAAGCGCAA TAAAACCGTA TAA

Protein sequence

MMNTEGNNGN KPLGLWNVVS IGIGAMVGAG IFALLGQAAL LMEASTWVAF AFGGIVAMFS 
GYAYARLGAS YPSNGGIIDF FRRGLGNGVF SLALSLLYLL TLAVSIAMVA HAFGAYAVQF 
LHEGSQEEHL ILLYALGSIA VMTLFNSLSN HAVGRLEVIL VGIKMMILLL LIIAGVWSLQ 
PAHISVSAPP SSGAFFSCIG ITFLAYAGFG MMANAADKVK DPQVIMPRAF LVAIGVTTLL 
YISLALVLLS DVSALELEKY ADTAVAQAAF PLLGHVGYVI VVIGALLATA SAINANLFAV 
FNIMDNMGSE RELPKLMNKS LWRQSTWGNI IVVVLIMLMT AALNLGSLAS VASATFLICY 
LAVFVVAIRL RHDIHASLPI LIVGTLVMLL VIVGFIYSLW SQGSRALIWI IGSLLLSLIV 
AMVMKRNKTV