Gene YPK_1998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YPK_1998
Symbol	araG
ID	6089192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis YPIII
Kingdom	Bacteria
Replicon accession	NC_010465
Strand	-
Start bp	2220530
End bp	2222101
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	50%
IMG OID	641597065
Product	L-arabinose transporter ATP-binding protein
Protein accession	YP_001720738
Protein GI	170024233
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGCAC CCCATTCTGC GTTACAAGCC GAGTTGGACG CCGCACAGTC ACCTTATCTG 
GCTTTTCGTG GCATCGGAAA AAGTTTCCCC GGTGTTCTGG CGCTGGATGA TATCAGTTTC 
ACCTGTCAGG CGGGCCAGAT CCATGCGCTG ATGGGCGAGA ATGGCGCGGG GAAATCAACC 
CTGTTAAAGA TCCTCAGTGG TAACTACACC CCGACACAGG GTGAAATCCA CATTAAAGGG 
AAAGCCGTTA ACTTTACCAA TACTACGGAT GCGTTGGATG CTGGTGTGGC GATCATTTAT 
CAGGAACTGC ATTTGGTGCC TGAAATGACA GTGGCAGAAA ACATCTATCT GGGCCAATTA 
CCCACCAAGA TGGGTATGGT TGATCGAAAA TTGCTGCGTT ATGAATCTCG CATACAGCTA 
TCACATCTGG GGTTGGACAT TGATCCCGAT ACCCCACTGA AATATCTCTC CATCGGCCAA 
TGGCAGATGG TGGAAATTGC CAAAGCATTA GCCCGCAATG CAAAAATAAT CGCCTTTGAT 
GAACCCACCA GTTCGCTCTC TGCCCGAGAA ATTGAGCAAC TGTTCCGCGT GATCCGCGAG 
TTACGGGCCG AAGGGCGGGT CATCTTGTAT GTCTCCCATC GAATGGAAGA AATTTTTGCC 
CTGAGTGATG CCATTACGGT GTTTAAAGAT GGCCGCTATG TTCGTACGTT TGATGATATG 
ACCCAAGTGA ATAATGCGTC ACTGGTGCAA GCTATGGTAG GGCGTAATTT AGGGGATATC 
TATGGTTATC AGCCCCGAGA GATAGGTTCT GAACGCTTAA CGCTACAAGC GGTGAAGGCC 
ATCGGTGTGG CCTCGCCGAT CAGCTTGACT GTACACCAAG GGGAAATTGT GGGGCTGTTT 
GGGTTAGTGG GGGCCGGGCG TAGTGAACTG CTCAAGGGGC TGTTTGGTGA CACCAAACTG 
ACCAGTGGGA AACTCTTGCT TGATGGCCAA CCACTGACTA TCCGTTCGCC GATTGACGCT 
ATTTCTGCTG GGATCATGTT GTGTCCAGAA GATCGAAAAG CGGATGGCAT CATTCCTGTT 
CACTCGGTAC AGGACAATAT CAATATCAGT GCCCGCCGCA AAACATTAAC CGCAGGCTGT 
CTGATTAACA ACCGCTGGGA AGCGGAGAAT GCGTTGCTGC GTATTCAGTC TCTGAATATT 
AAAACGCCAG GCCCCCAACA ACTCATTATG AATCTATCCG GGGGGAATCA GCAGAAAGCC 
ATTTTAGGGC GCTGGTTGTC CGAGGACATG AAAGTGATCC TGTTGGATGA ACCGACCCGT 
GGTATTGACG TCGGGGCCAA ACATGAAATC TATAACGTGA TTTATCAACT GGCGAAACAG 
GGCATTGCGG TGCTGTTTGC TTCCAGTGAT TTGCCGGAAG TGCTTGGGCT GGCAGATCGT 
ATTGTGGTGA TGCGTGAGGG CGCTATCTCT GGTGAGCTAG ACCATGAATA TGCCACTGAA 
GAGCAAGCCT TAAGTCTGGC AATGTTACGC ACCCCGAATA TTGCCACCAA TACCGCGTCT 
GCGGTTGCCT GA

Protein sequence

MSAPHSALQA ELDAAQSPYL AFRGIGKSFP GVLALDDISF TCQAGQIHAL MGENGAGKST 
LLKILSGNYT PTQGEIHIKG KAVNFTNTTD ALDAGVAIIY QELHLVPEMT VAENIYLGQL 
PTKMGMVDRK LLRYESRIQL SHLGLDIDPD TPLKYLSIGQ WQMVEIAKAL ARNAKIIAFD 
EPTSSLSARE IEQLFRVIRE LRAEGRVILY VSHRMEEIFA LSDAITVFKD GRYVRTFDDM 
TQVNNASLVQ AMVGRNLGDI YGYQPREIGS ERLTLQAVKA IGVASPISLT VHQGEIVGLF 
GLVGAGRSEL LKGLFGDTKL TSGKLLLDGQ PLTIRSPIDA ISAGIMLCPE DRKADGIIPV 
HSVQDNINIS ARRKTLTAGC LINNRWEAEN ALLRIQSLNI KTPGPQQLIM NLSGGNQQKA 
ILGRWLSEDM KVILLDEPTR GIDVGAKHEI YNVIYQLAKQ GIAVLFASSD LPEVLGLADR 
IVVMREGAIS GELDHEYATE EQALSLAMLR TPNIATNTAS AVA