Gene Acid345_0005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0005
Symbol
ID	4070015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4984
End bp	6249
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	57%
IMG OID	637982005
Product	major facilitator transporter
Protein accession	YP_589084
Protein GI	94967036
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0753564
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.228788
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAGAA GCTATGCCAT CGTCGCGCTG TTGATGCTGG TTTACTTCGT ACTGTCCTTC 
CTGACCAACA TCCTTGGTCC CATCATTCCC GACATCATTA CGAGCTTCCA CGTAAGCCTC 
ACGGCGGCGG CGATTCTTCC GTTTGCATTT TTCATTGCGT ACGGAGTGAT GTCGATTCCG 
GGAGGGTTCC TGGTCGAACG GTTTAGTGAA AAGCCGGTGA TGGTGGCCTC ATTTTTTGCG 
GCCACGATAG GCGCTCTGGT TTTTGCGGTG CATCCCTCGT ACCTTGTTGC GATCGTGTCG 
TTGTTCGTGA TGGGCGGCGG CATGGCGGTG CTGCAAGTCG CGCTCAATCC TTTGCTGCGA 
GTCGCTGGAG GAGAGGAGAA TTTCGCATTC AACTCGGCGC TGGCGCAACT CGTCTTCGGT 
CTAGCTTCGT TCCTCAGTCC GCTGGTGTTC TCTTATCTTG TCGAAAACCT TCCGAAATTG 
TCGGGACACA ATTGGTTTGT CCATCTGCTC GCGGCGGTCA CGCCCGCGCA ATGGCCGTGG 
TTGTCGATGT ACTGGATTTT CGCGGCCTCG ACCGCTCTGA TGGTCATCCT GCTCCTGGTT 
GTACGGTTTC CGGCTGTACA GCGCACCAGT GACGAAGCGG CGGGGTCCCG CGAGATGTAC 
AGCGCGCTGA TGAAGAGACC GATGGTGTGG CTCTACTTCG GCTGTATTTT CGCGTACGTC 
GGATGCGAGC AGGGTGTCGC CGTCTGGATG TCGAAGTTCC TGGAGCAATA CCATGGCTTC 
GACCCACATA CCACCGGGGC GAGTGCAGTG TCATGGTTCT GGGGGCTGAT GACGGCGGGA 
TGCCTGCTTG GGCTCGTCCT GCTGAAATTG TTCGATAGCC GTCGCGTGCT GCTGGCGTTT 
TCGTTCGGCG CGGTTGGCTG CCTCACCGTG GCGCTGTTTG GCCCTGCTAA GGCGGCGCTG 
TACGCCTTCC CAGCGATTGG GCTGTTTGCT TCCATCATGT GGCCTACGCT GATGTCACTC 
GCCCTCAATT CCGTCTCAGA GCATCATGGC TCGTTCGCGG GCATTCTTTG TACCGGCATC 
ATGGGTGGTG CGGTTGTTCC GCTTATCATC GGCCGCCTTG GCGATATGTT CGGGCTACGT 
TACGGGATGA TGGTGCTCTA CCTCACCTTC GGATGCGTTT TGAGCGTGGG ATTGTGGGCC 
AAGCCAATTA TCAGCAACGC TACATTCAGT TCGAATCCAG GAACTCCGTT GCCTGATGCT 
AAGTAG

Protein sequence

MRRSYAIVAL LMLVYFVLSF LTNILGPIIP DIITSFHVSL TAAAILPFAF FIAYGVMSIP 
GGFLVERFSE KPVMVASFFA ATIGALVFAV HPSYLVAIVS LFVMGGGMAV LQVALNPLLR 
VAGGEENFAF NSALAQLVFG LASFLSPLVF SYLVENLPKL SGHNWFVHLL AAVTPAQWPW 
LSMYWIFAAS TALMVILLLV VRFPAVQRTS DEAAGSREMY SALMKRPMVW LYFGCIFAYV 
GCEQGVAVWM SKFLEQYHGF DPHTTGASAV SWFWGLMTAG CLLGLVLLKL FDSRRVLLAF 
SFGAVGCLTV ALFGPAKAAL YAFPAIGLFA SIMWPTLMSL ALNSVSEHHG SFAGILCTGI 
MGGAVVPLII GRLGDMFGLR YGMMVLYLTF GCVLSVGLWA KPIISNATFS SNPGTPLPDA 
K