Gene Bcep18194_B0047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_B0047
Symbol	araH
ID	3751901
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007511
Strand	+
Start bp	52529
End bp	53548
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	67%
IMG OID	637764893
Product	L-arabinose transporter permease protein
Protein accession	YP_370808
Protein GI	78060900
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.149615
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGG CAATGCAACC CCAACGCACG TCCCCGTCCG CCGATGCCGC CGCCGTACCC 
GCGCGAGCGC GCGGCGGCGT GTGGCAGCTG ATCAACCGCT CCGGCATCGT GATGGTGTTT 
CTCGTGCTGT TCGCGACGCT GTCGCTGACC GTGCCGGACT TCCTCACGCC GCGCAACATC 
CAGGGCCTGC TGCTGTCGGT CACGCTGATC GGCTCGATCG CGGTGACGAT GATGTTCGTG 
CTCGCGCTCG GCGAGGTCGA CCTGTCGGTC GCGTCGATCG TCGCGTTCTC GGGCGTCGTC 
GCGTCGACGC TGATCACCGC GACGCACAGC GTCGTGCTCG GCATCGCGGG CGGCGTGCTC 
GCGGGCGGTG CGGTCGGGCT CGTCAACGGC GTGCTGATCG CGCGCTGGCG GATCAACTCG 
CTGATCGTCA CGCTCGCGAT GATGGAAGTC GTGCGCGGAC TCGCGTTCAT CACGTCGAAC 
GGCGACGCGG TGATGATCTC CGAGGAGCGC TTCTTCGATC TCGGCGGCGG GTCGTTTCTC 
GGCATCTCGT ATCCGATCTG GAGCAACATC GTCGGCTTCG TCGTGTTCGG CTTCCTGCTG 
CGCAAGACGG TGTTCGGCAA GAACGTGCTG GCCGTCGGCG GCAACGGCGA GGCCGCGCTG 
CTCGCGGGGC TGCCGGTGAT GCGCATCAAG ATCACCGTGT TCGTGCTGCA GGGGCTCGTG 
ACGGGCTTCG CGGGCGTGAT GCTCGCGTCG CGGATGAGCC TCGGCGACCC GAAGACGTCG 
GTCGGGCTCG AACTCGGCGT GATCTCCGCG TGCGTGCTCG GCGGCGTATC GCTGACGGGC 
GGCGTCGCGA CGATCTCCGG CGTGCTGGTC GGCGTGCTGA TCATGGGCTC TGTCCAGGAT 
GCGATGAGCC TGCTGAACGT GCCGACGTTT TACCAATATT TGATACGCGG CGGGATTCTG 
TTGCTCGCGG TGCTGTTCGA CCAGTATCGT CGCAACCAGC GGCGCGCGAT GAAGCTCTGA

Protein sequence

MSQAMQPQRT SPSADAAAVP ARARGGVWQL INRSGIVMVF LVLFATLSLT VPDFLTPRNI 
QGLLLSVTLI GSIAVTMMFV LALGEVDLSV ASIVAFSGVV ASTLITATHS VVLGIAGGVL 
AGGAVGLVNG VLIARWRINS LIVTLAMMEV VRGLAFITSN GDAVMISEER FFDLGGGSFL 
GISYPIWSNI VGFVVFGFLL RKTVFGKNVL AVGGNGEAAL LAGLPVMRIK ITVFVLQGLV 
TGFAGVMLAS RMSLGDPKTS VGLELGVISA CVLGGVSLTG GVATISGVLV GVLIMGSVQD 
AMSLLNVPTF YQYLIRGGIL LLAVLFDQYR RNQRRAMKL