Gene EcE24377A_2131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2131
Symbol	araG
ID	5587532
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	2110376
End bp	2111890
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	52%
IMG OID	640925801
Product	L-arabinose transporter ATP-binding protein
Protein accession	YP_001463204
Protein GI	157156751
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00340592
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACAGT CTACCCCGTA TCTCTCATTT CGCGGCATCG GTAAAACGTT TCCCGGCGTT 
AAGGCGCTGA CGGATATTAG TTTTGACTGC TATGCCGGTC AGGTTCATGC GTTGATGGGT 
GAAAATGGCG CGGGAAAATC AACTCTCTTA AAAATCCTCA GCGGCAACTA TGCGCCAACC 
ACGGGTTCTG TAGTGATTAA TGGGCAGGAA ATGTCCTTTT CCGACACGAC CGCAGCACTT 
AACGCGGGTG TGGCGATTAT TTACCAGGAA CTGCATCTCG TGCCGGAAAT GACCGTCGCG 
GAAAACATCT ATCTCGGCCA GCTGCCGCAT AAAGGCGGCA TTGTGAATCG CTCATTGCTG 
AATTATGAGG CGGGTTTACA ACTTAAACAT CTTGGTATGG ATATTGACCC GGACACGCCG 
CTGAAATATC TCTCCATTGG TCAGTGGCAG ATGGTTGAAA TCGCCAAGGC GCTGGCGCGT 
AACGCTAAAA TTATCGCCTT TGATGAGCCA ACCAGCTCCC TTTCTGCCCG CGAAATCGAC 
AATCTTTTCC GCGTTATTCG TGAACTGCGA AAAGAGGGGC GGGTGATCTT ATACGTTTCT 
CACCGTATGG AAGAAATATT TGCCCTCAGC GATGCCATCA CTGTCTTTAA AGATGGACGT 
TATGTCAAAA CCTTTACCGA TATGCAGCAG GTTGACCACG ACGCGCTGGT GCAGGCGATG 
GTCGGGCGCG ACATTGGCGA TATCTACGGC TGGCAACCTC GTAGTTATGG CGAGGAGCGC 
CTGCGTCTTG ATGCTGTGAA AGCACCAGGC GTGCGTACGC CAATAAGTCT GGCGGTTCGC 
AGTGGTGAAA TTGTTGGGCT GTTTGGTCTG GTAGGAGCGG GGCGTAGCGA ATTAATGAAA 
GGCTTGTTTG GCGGGACGCA AATCACCGCC GGTCAGGTTT ATATCGACCA ACAGCCGATC 
GATATTCGTA AACCGAGCCA CGCCATTGCC GCAGGCATGA TGCTCTGCCC GGAAGATCGC 
AAAGCGGAAG GCATTATTCC CGTGCACTCC GTTCGCGACA ATATCAACAT CAGTGCCAGA 
CGTAAACATG TGCTCGGCGG TTGTGTAATC AACAACGGTT GGGAAGAAAA CAATGCCGAT 
CACCACATTC GTTCGCTCAA CATCAAAACG CCGGGCGCTG AGCAACTGAT CATGAATCTC 
TCAGGCGGAA ATCAGCAAAA AGCCATTCTG GGCCGCTGGT TATCGGAAGA GATGAAGGTC 
ATTTTGCTGG ATGAACCTAC GCGCGGCATT GATGTTGGTG CTAAGCATGA AATTTACAAC 
GTGATTTATG CGCTGGCGGC GCAGGGTGTG GCGGTGCTGT TTGCCTCCAG CGACTTACCT 
GAAGTCCTCG GCGTTGCCGA CCGGATTGTG GTGATGCGGG AAGGTGAAAT CGCCGGTGAA 
TTGTTACACG AGCAGGCAGA TGAGCGTCAG GCACTGAGCC TTGCGATGCC TAAAGTCAGC 
CAGGCAGTTG CCTGA

Protein sequence

MQQSTPYLSF RGIGKTFPGV KALTDISFDC YAGQVHALMG ENGAGKSTLL KILSGNYAPT 
TGSVVINGQE MSFSDTTAAL NAGVAIIYQE LHLVPEMTVA ENIYLGQLPH KGGIVNRSLL 
NYEAGLQLKH LGMDIDPDTP LKYLSIGQWQ MVEIAKALAR NAKIIAFDEP TSSLSAREID 
NLFRVIRELR KEGRVILYVS HRMEEIFALS DAITVFKDGR YVKTFTDMQQ VDHDALVQAM 
VGRDIGDIYG WQPRSYGEER LRLDAVKAPG VRTPISLAVR SGEIVGLFGL VGAGRSELMK 
GLFGGTQITA GQVYIDQQPI DIRKPSHAIA AGMMLCPEDR KAEGIIPVHS VRDNINISAR 
RKHVLGGCVI NNGWEENNAD HHIRSLNIKT PGAEQLIMNL SGGNQQKAIL GRWLSEEMKV 
ILLDEPTRGI DVGAKHEIYN VIYALAAQGV AVLFASSDLP EVLGVADRIV VMREGEIAGE 
LLHEQADERQ ALSLAMPKVS QAVA