Gene Acid345_1149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1149
Symbol
ID	4069958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1432841
End bp	1434064
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	62%
IMG OID	637983159
Product	major facilitator transporter
Protein accession	YP_590226
Protein GI	94968178
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.299661
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATTCGT CGGCCCCGAA CCCGGACAGA AGTACCAGCA TGAGCCTGAT CGCGGTCATG 
CTCGCGGGCG CGTGCACATT TCTCAACGTC TATTGCACCC AGCCTCTGCT GCCATTTCTT 
CGACGCTTAT TTCACGCATC GGAACTCCAG GTCAGTCTTA CGGTGAGCGC GACCACGTTC 
GGTGTCGCCA TCGCGGCGCC CATCGTCGGC TTAATGGCAG AGCGCATTGG ACGCAAGAAG 
GTCATTGTTC CCGCGCTGTT CTGGCTTACC GTTCCAACTC TGCTCGCTGC AACCTCCACT 
GGCATCTGGT CGATGGTGCT GTGGCGCTTC CTGCAAGGCA TCTGCGTCCC GGGAATTATT 
GCGGTGATGA TCGCCTACAT CGGCGAAGAA TTCAGCGGCA TCAATGTAGG CAGCGTGATG 
GCTTCCTATG TGACCGGCAC CGTGTTCGGC GGTTTTCTTG GCCGTTTCAT CGCCGGACTG 
GTCGCCACCC ACTGGCATTG GCGCGCCGCT TTTGTCGTCA TCGGCGTCAT CAACCTGTGC 
GGAGCGATCG CCGTTCGACA ATGGCTGCCC AAAGCCAGGA ACTTCAAAAA AGCCGAAGAC 
ATTAACGCAA CGCTCAATGA CATGCGGATG CACCTGCGCA ATCCGCGGCT GCTGGCCACG 
GTCGCCATGG GATTCGGCGT ACTCTTCTCG CTGGTCGGCG CATTCACTTA CGTGAACTTC 
TACTTGGCAG CGCCGCCATT CCACCTCAGC AGTGCCGCTC TGGGCACGAT CTTCTGCGTC 
TACCTGCTCG GTCTCATCAT TACGCCGCTC TCCGGACGCT TCCTGGACCG CAGCGGCTTC 
CGCAATACCG CGATTGTGGC CACGGCGTTC GCGCTCACAG GACTTGCCTG CACGCTCTCG 
CAGCACCTCA GCATAGTGAT CGTGGGCCTG GCGCTGTTCT CCTCCGGCAT CTTCATCTAC 
CAGGCCGCCG CCACGGTACA GACCGGCATC AACGCCGGCC GCGCCCGCTC TTCTGCCGCC 
GGACTCTACG TCACTCTCTA CTACATTGGT GGCAGCGTGG GCGCGACAGC GCTCGGTTGG 
GTGTGGCTCT GGCGCGGCTG GCACGCCTGC GTTGCCGCGA TCGCCGTGGC CTCGTTGCTC 
ACGCTCGTCT GTGCGTTCCT CAGCAGCTCG CCGACGGAGC GCATCCCTGC GCGCGTCGTC 
ACCGAGTCTG CCGAGGTCAG CTAA

Protein sequence

MNSSAPNPDR STSMSLIAVM LAGACTFLNV YCTQPLLPFL RRLFHASELQ VSLTVSATTF 
GVAIAAPIVG LMAERIGRKK VIVPALFWLT VPTLLAATST GIWSMVLWRF LQGICVPGII 
AVMIAYIGEE FSGINVGSVM ASYVTGTVFG GFLGRFIAGL VATHWHWRAA FVVIGVINLC 
GAIAVRQWLP KARNFKKAED INATLNDMRM HLRNPRLLAT VAMGFGVLFS LVGAFTYVNF 
YLAAPPFHLS SAALGTIFCV YLLGLIITPL SGRFLDRSGF RNTAIVATAF ALTGLACTLS 
QHLSIVIVGL ALFSSGIFIY QAAATVQTGI NAGRARSSAA GLYVTLYYIG GSVGATALGW 
VWLWRGWHAC VAAIAVASLL TLVCAFLSSS PTERIPARVV TESAEVS