Gene SbBS512_E3944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3944
Symbol
ID	6273014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3677938
End bp	3678951
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	54%
IMG OID	641727794
Product	2,3-diketo-l-gulonate trap transporter large permease protein yian
Protein accession	YP_001882227
Protein GI	187732351
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1593] TRAP-type C4-dicarboxylate transport system, large permease component
TIGRFAM ID	[TIGR00786] TRAP transporter, DctM subunit

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGTGC TGATTTTTCT GGGCTGTCTG TTGGGTGGTA TTGCTATCGG TTTGCCTATT 
GCCTGGGCAC TGTTGTTGTG CGGGGCGGCG TTAATGTTCT GGCTGGACAT GTTTGATGTC 
CAGATCATGG CACAAACGCT GGTGAACGGA GCCGATAGCT TCTCCCTGCT GGCGATTCCG 
TTCTTTGTGC TGGCGGGTGA AATCATGAAT GCGGGCGGCT TGTCAAAACG CATTGTTGAC 
CTGCCGATGA AACTGGTGGG GCATAAACCA GGCGGGCTGG GCTACGTCGG CGTGCTGGCA 
GCTATGATTA TGGCGAGCCT TTCTGGTTCT GCCGTTGCGG ATACCGCCGC CGTTGCCGCT 
CTACTGGTGC CGATGATGCG CAGCGCCAAC TACCCGGTCA ACCGGGCGGC GGGGCTGATT 
GCCTCTGGCG GCATTATCGC GCCAATTATT CCCCCTTCCA TTCCGTTTAT TATCTTCGGC 
GTTTCCAGCG GATTATCCAT CAGTAAGCTG TTTATGGCGG GCATTGCCCC TGGCATGATG 
ATGGGCGCAA CGCTGATGCT TACCTGGTGG TGGCAGGCCA GTCGCCTTAA TTTACCCCGC 
CAGCAAAAAG CAACGATGCA GGAAATCTGG CACTCTTTTG TCTCCGGTAT CTGGGCTCTG 
TTTCTTTCAG TCATCATTAT TGGCGGGTTT CGCTCCGGTC TGTTTACCCC TACCGAAGCC 
GGGGCCGTTG CTGCTTTCTA TGCGCTGTTT GTCGCCACAG TTATTTACCG TGAAATGGCC 
TTCGCCACAC TTTGGCATGT ACTCATTGGC GCGGCGAAAA CCACCTCAGT GGTTATGTTT 
CTGGTGGCCT CGGCACAAGT TTCCGCCTGG CTGATTACCA TTGCTGAACT GCCGATGATG 
GTTTCTGATT TACTGCAACC GTTGGTCGAT TCACCGCGTC TGCTGTTTAT CGTCATTATG 
GTGGCTATCC TGATTGTCGG CATGGTCGGT AATGCTGCCA ACTTACTGAT TTAG

Protein sequence

MAVLIFLGCL LGGIAIGLPI AWALLLCGAA LMFWLDMFDV QIMAQTLVNG ADSFSLLAIP 
FFVLAGEIMN AGGLSKRIVD LPMKLVGHKP GGLGYVGVLA AMIMASLSGS AVADTAAVAA 
LLVPMMRSAN YPVNRAAGLI ASGGIIAPII PPSIPFIIFG VSSGLSISKL FMAGIAPGMM 
MGATLMLTWW WQASRLNLPR QQKATMQEIW HSFVSGIWAL FLSVIIIGGF RSGLFTPTEA 
GAVAAFYALF VATVIYREMA FATLWHVLIG AAKTTSVVMF LVASAQVSAW LITIAELPMM 
VSDLLQPLVD SPRLLFIVIM VAILIVGMVG NAANLLI