Gene BCG9842_B4495 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCG9842_B4495
Symbol
ID	7181644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus G9842
Kingdom	Bacteria
Replicon accession	NC_011772
Strand	-
Start bp	774063
End bp	775265
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	39%
IMG OID	643548573
Product	major facilitator family transporter
Protein accession	YP_002444244
Protein GI	218895833
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000363259
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0000000000000205787
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGGAGAAG CAATACTCGT AAAACGAGAA CCGTTATGGA CAAAAGAGTT TGTTGCTTTA 
ATTTTTGCAA ACTTATGTAT GTTTTTAGGG TTTCAAATGT TAATTCCAAC CTTACCTGTT 
TATGTGAAAG AAATTGGTGG CACAAGTTCC AATATCGGAT TTGTTGTCGG TATGTTTACC 
GTTGCGGCAC TTTTTGTTAG ACCGCTAACT GGGAACGCCT TGCAAAAATT TAATAAAAAA 
ATCATTTTAA TGATCGGTAC TGCTATCTGT TTACTCGCTA TGGGCAGTTA CCTTTTCGCC 
TCAACTATCT TTCTCTTGCT TGCTGTTCGT ATTTTACACG GAGCTGGTTT CGGTATTACA 
ACGACTACAT ATGGAACTGT CGTTTCTGAT TTAATTCCCT CAGCTCGCCG CGGAGAAGGC 
ATGGGATATT TTGGCCTTTC TGGAACAATT GCAATGGCCC TCGGTCCACT TATAGGACTA 
TGGCTCATGC AAACATATAA CTTCACAATT CTTTTTTTAT GTGCACTATC GTGCACAATT 
GTTTCATTAA TATTAACGAA ACTACTTCAA ATCCAAAAAA CGAAACAGCC GCCACAACAA 
TCATCTAGTA CTTTTCTCGA TGGATTTATT GAGCGTAAAG CTTTACTTCC TTCATTATTA 
ATATTATGTA TTACATTAAT GTACGGAGGA ATCGGAAGTT TTATCACACT ATTTGCTACA 
GAAGTCGGCA TAGCTGATAT TAGCCTCTTC TTTTTATGTA ATGCACTAGC AATTGCTGTA 
ACTCGTCCAT TCTCTGGAAG GCTATATGAT GCGAAAGGCC ATACATTCGT CATCATTCCG 
GGAGTTATTA TAACGTTTAC AGGCATTATT TTATTGTCGT ATACGACGAC AATTCCGAGC 
TTAATTATTG CTGCAGCATG TTACGGAAGT GGTTTTGGAG CGATCCAACC TGCACTACAA 
GCATGGATGA TTGACCGCGT AGCACCGCAT CGACGCGGCG TAGCAACAGC TACATTCTTC 
TCCGCATTTG ACCTTGGAAT CGGCGCTGGA GCGATTATAT TTGGATTTAT TGCTCATTTT 
ACAAACTATG CAACTGTATA TCGTTACTCC TCTCTATTAC TTATTGCTTT TCTCTTCATT 
TACATTACAA GCATAAGAAA ACAAAAGTAT GGCGATAAAA ACATGGAAAA AGCTGCTGGA 
TAA

Protein sequence

MGEAILVKRE PLWTKEFVAL IFANLCMFLG FQMLIPTLPV YVKEIGGTSS NIGFVVGMFT 
VAALFVRPLT GNALQKFNKK IILMIGTAIC LLAMGSYLFA STIFLLLAVR ILHGAGFGIT 
TTTYGTVVSD LIPSARRGEG MGYFGLSGTI AMALGPLIGL WLMQTYNFTI LFLCALSCTI 
VSLILTKLLQ IQKTKQPPQQ SSSTFLDGFI ERKALLPSLL ILCITLMYGG IGSFITLFAT 
EVGIADISLF FLCNALAIAV TRPFSGRLYD AKGHTFVIIP GVIITFTGII LLSYTTTIPS 
LIIAAACYGS GFGAIQPALQ AWMIDRVAPH RRGVATATFF SAFDLGIGAG AIIFGFIAHF 
TNYATVYRYS SLLLIAFLFI YITSIRKQKY GDKNMEKAAG