Gene Acid345_1627 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1627
Symbol
ID	4072553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1974220
End bp	1975683
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	56%
IMG OID	637983636
Product	major facilitator transporter
Protein accession	YP_590703
Protein GI	94968655
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.518236
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAACC CCGTTCCCCA AGCCAACGCT GAGTACAGCA TCTGGCGCGT GATCATGGCT 
TCCTCTCTCG GGACCATGAT TGAGTGGTAC GACTTCTATA TTTTCGGCAG CCTCGCGGCT 
ATTCTCGGAC CTAAATTCTA TCCGCCCGGC AACGATACCT TCGCCTACAT CGCTTACCTC 
GCAACCTTCG CCGTCGGCTT CCTCGTGCGC CCATTCGGCG CATTGTTCTT CGGACGTATC 
GGCGATCTGA TCGGTCGCAA GTACGCCTTT CTGGTGACTC TCTCGATCAT GGGCTTCTCG 
ACATTCGCGA TCGGACTGCT GCCTTCGTTC GCAAAAGCTG GATGGTTCGC CCCAATTGTT 
CTGCTCGCCA TCCGCATCCT GCAAGGGCTC GCGCTGGGCG GCGAATACGG TGGCGCGGCT 
GTTTATGTCG GCGAACACGT ACCCGACAAC AAGCGTGGCT TCTACACCAG TTTCATCCAG 
ATCACTGCTA CGCTCGGCCT CTTTGTTTCC CTCATCGTCA TTCTCGTAAC GCAGAGCTCG 
ATGTCGAAGG AAGCCTTTGC TGCCTGGGGC TGGCGCATTC CGTTCCTCAT TTCGATCTTC 
CTGGTGGTGA TGTCTCTGTA CATCCGCTTG AAGATGAAAG AGTCGCCGAT CTTTGCGCAG 
TTGAAAGCCG CAGGAATGAC CTCAACCCAG CCGCTCAAGG ACGCCTTCAC TCAGTGGCCA 
AACCTGAAGA ACGTACTGAT CTCGCTTTTT GGCGCGACAG CTGGGCAAGG GGTGATCTGG 
TACACAGGTC AGTTCTACGC GCTCTTCTAT CTTCAAACCA TCTTGAAAGT CAACGTTCGC 
ACCGCGAACA TCATCGTGGC TATCGCGCTC CTGCTTGGGA TGCCGTTCTT CACCGTTGCA 
GGCGCGCTCT CTGATCGATT TGGCCGCAAA AAACTGATGA TGGCCGCCTG TTTGCTCGCA 
GTGATCAGTT ACATTCCGAT TTACAAGGCC ATGCAGAGTG CGGCAGGCAA CGACGTGGTC 
ACCGTAAAGT CCGCCAGGAA TAAAGTCACT GGCGCCATCG GGCTTACGCC CCTTACTCAC 
GATGCTACGG GCGCTCTGGT TCCCGCAAAG GAAGCTCCCA ATCCAAATGT GCCTGCCTTA 
GTCGGGCTGA TCTTCGCCCA GGTGCTGCTC GTATGCATGA TTTACGGTCC GATTGCGGCG 
TATCTCATTG AGGCTTTCCC AGCGAAAGTC CGCTACACGT CGCTCTCACT GCCCTATCAC 
ATTGGCAACG GAGTCTTTGG CGGCCTATTG CCTTTGATTG GCCTTTCCAG TGTCGCGGCA 
ACGGGAAACA TCTATGCGGG ACTGTATTAC CCCATGATCG TCGCCGGCCT CACCTTTATC 
TTCGGCAGCC TGCTGCTGCG TGAAACCATG GGCCACCGCA TTTGGGACGA AACCGACGGA 
AAAGTGGCGA TCGCTTCCAA GTGA

Protein sequence

MANPVPQANA EYSIWRVIMA SSLGTMIEWY DFYIFGSLAA ILGPKFYPPG NDTFAYIAYL 
ATFAVGFLVR PFGALFFGRI GDLIGRKYAF LVTLSIMGFS TFAIGLLPSF AKAGWFAPIV 
LLAIRILQGL ALGGEYGGAA VYVGEHVPDN KRGFYTSFIQ ITATLGLFVS LIVILVTQSS 
MSKEAFAAWG WRIPFLISIF LVVMSLYIRL KMKESPIFAQ LKAAGMTSTQ PLKDAFTQWP 
NLKNVLISLF GATAGQGVIW YTGQFYALFY LQTILKVNVR TANIIVAIAL LLGMPFFTVA 
GALSDRFGRK KLMMAACLLA VISYIPIYKA MQSAAGNDVV TVKSARNKVT GAIGLTPLTH 
DATGALVPAK EAPNPNVPAL VGLIFAQVLL VCMIYGPIAA YLIEAFPAKV RYTSLSLPYH 
IGNGVFGGLL PLIGLSSVAA TGNIYAGLYY PMIVAGLTFI FGSLLLRETM GHRIWDETDG 
KVAIASK