Gene GWCH70_3374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_3374
Symbol
ID	7977130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	3401032
End bp	3402228
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	47%
IMG OID	644800141
Product	major facilitator superfamily MFS_1
Protein accession	YP_002951280
Protein GI	239828656
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0000527195
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTCAAC AAACGATTTC GCAGCGAAAG CTGTTAGGAG TTGCCGGGCT TGGCTGGATG 
TTTGACGCGA TGGATGTTGG CATGCTGTCG TTTATTATCG CGGCGTTGCA AAAAGATTGG 
AACTTAAGTG TCGAACAAAT GGGATGGATC GGCAGCATCA ACTCCATCGG TATGGCAGTT 
GGCGCGCTGT TATTCGGATT GTTGGCCGAC CGCATCGGCA GAAAAAACGT GTTTATTATT 
ACACTATTAT TATTCTCGAT CGGAAGCGGA CTATCTGCCT TAACGACGAC ATTGACGGCG 
TTTTTAGTTT TACGGTTTCT CATAGGCATG GGGTTGGGCG GAGAACTGCC GGTTGCTTCG 
ACGCTTGTAT CGGAAAGCGT GCCGGCGCAA GAACGTGGAA AAGCTGTTGT GCTGCTGGAA 
AGCTTTTGGG CAGTCGGCTG GTTGTTATCC GCGTTAATTT CATATTTTGT CATTCCAACA 
TACGGTTGGC AAACAGCGCT ATTGCTTGCG GCGATTCCGG CGTTATACGC CCTATATTTA 
CGATGGGGAT TGCCTGATTC GCCAAGGTTT ACAAGTGCGC GCAAAGAAGA AACCGTATGG 
GACAACATCG TCAAGGTTTG GTCGTCTTCT TACCGGAAAG AAACGTTCAT GCTTTGGGTG 
CTTTGGTTTT GCGTCGTATT TTCTTACTAC GGTATGTTTT TATGGCTGCC AAGCGTAATG 
GTTATGAAAG GGTTTAGCTT AATTAAAAGC TTCGAGTATG TCTTGATTAT GACGCTGGCG 
CAATTGCCTG GCTATTTTAG CGCCGCATGG CTTATTGAAC GAGCGGGTCG GAAATTTGTG 
CTCATCACGT ATTTGATTGG TACGGCCGTT AGTGCCTATT TCTTTGGCAA CGCGGATTCG 
CTTGCACTGC TCATGACCTT TGGCATTTTA CTATCGTTTT TTAACCTTGG CGCATGGGGA 
GCGTTATACG CCTATACTCC AGAGCTTTAC CCGACTTCGA TTCGCGGCAC GGGAGCTGGG 
ATGGCGGCGT CATTTGGACG CATCGGCGGC ATTTTAGGAC CGCTTTTCGT CGGCTATCTT 
GTCAATAGAC ATATTACGAT TACAACGATT TTTCTGATTT TCTGTATTTC TATTTTCATT 
GGCGTTATTG CGGTATGGGT GTTAGGAAAA GAAACGAAGC AACAGGAATT GGCATAG

Protein sequence

MLQQTISQRK LLGVAGLGWM FDAMDVGMLS FIIAALQKDW NLSVEQMGWI GSINSIGMAV 
GALLFGLLAD RIGRKNVFII TLLLFSIGSG LSALTTTLTA FLVLRFLIGM GLGGELPVAS 
TLVSESVPAQ ERGKAVVLLE SFWAVGWLLS ALISYFVIPT YGWQTALLLA AIPALYALYL 
RWGLPDSPRF TSARKEETVW DNIVKVWSSS YRKETFMLWV LWFCVVFSYY GMFLWLPSVM 
VMKGFSLIKS FEYVLIMTLA QLPGYFSAAW LIERAGRKFV LITYLIGTAV SAYFFGNADS 
LALLMTFGIL LSFFNLGAWG ALYAYTPELY PTSIRGTGAG MAASFGRIGG ILGPLFVGYL 
VNRHITITTI FLIFCISIFI GVIAVWVLGK ETKQQELA