Gene Acid345_2632 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2632
Symbol
ID	4072041
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3103714
End bp	3104922
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	61%
IMG OID	637984649
Product	major facilitator transporter
Protein accession	YP_591707
Protein GI	94969659
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.127081
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.954997
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCTCGC AGGCCACTCC CGCGCAGCGC CGCACCTTGC TCGCCGCTGC GCTTGGCTGG 
GCACTGGATG CTTTCGACGT CATGCTCTAC GCGATGGTCG TGGCATACGT CATGCGCGAC 
CTCCGCATTG ATAAGCCGAC TGTCGGCCTG CTGAACACAC TCACACTTCT TGCCAGCGGT 
ATCGGCGGCC TGCTCTTCGG CTGGATCGCA GATCGCGTCG GCCGCACCCG TGCGCTGATG 
CTCAGCATCG CGACTTACTC GATCTGCTCC TTCGCCTCGG GACTTTCAAC TTCGGTGCAG 
ATGCTGGCTG CCTGCCGTTT CGTGCTCGGA CTCGGCATGG GTGGCGAGTG GAACACCGGC 
GCTACGCTCG TAGCGGAAAC TTGGCCGACC CATCTTCGTG CGAAAGCCAT CGCCGTAGTG 
CAAAGCTCGT GGGCATGGGG CTACGCTGCT GCGGCGCTCG TTGCCGGACT CACGCTGCAA 
TATTCTCAGA ACTGGCGTTA TGTGTTCTTC GTGGGCATCG CGCCGGCTTT GCTTCTGCTG 
TGGATTCAAA AGGAAGTGCC GGAGTCCGAA CTCTGGCAGA AACAGCAAAC GAACAAAGCA 
CCGAACGCGA AGCTTTCATC GGAACACGTG CGCAACGCGA TCGTCTTGCT CGCTCTCAAT 
TTCTTCGGCC TCTTCGCCTG GTGGGGGCTG TTTACCTGGA TTCCGCCGTA CCTCTCGCTT 
CCCGTCGAGC AAGGCGGACG CGGCTTCTCG CAACTTGGCA CCACCGGACT GCTCGTCTTT 
CTAAATCTGG TTGGGATGTT CCCCGGCTAC ATCAGCTTCG GGTTCTTCGC CGATCGCATA 
GGACGCCGCT GGTCGTTCTT TCTTTATCTT TTCGCTGCCG CCTGCGTAGT TCCGATCTAT 
GCAGCTGCGC GACAGCCGTG GCAGATTCTC GTCATGGGAG CGGTTGTCGC GTTCTTCGGA 
ACCGGCTTCT TTTCCGGCTC CGGCATTGTT GGCTCAGAGC TATTTCCGAC GCACGTCCGC 
GCTCGCGCGC TCGGACTGAC CTATAACGGC GCACGCATGC TGAGCTGCGT TGCACCGTAC 
GTCATCGGCT CGCTGAGCAT GCACCGCGGA CTGAGCGGAG CCTTCGTGGT TTGTGCGGTG 
GGATTCCTGC TGGCGGCTTT CACCGCGCTC CTGTTACCAG AAACGCGGGG CCGCGAACTT 
GCGAATTGA

Protein sequence

MFSQATPAQR RTLLAAALGW ALDAFDVMLY AMVVAYVMRD LRIDKPTVGL LNTLTLLASG 
IGGLLFGWIA DRVGRTRALM LSIATYSICS FASGLSTSVQ MLAACRFVLG LGMGGEWNTG 
ATLVAETWPT HLRAKAIAVV QSSWAWGYAA AALVAGLTLQ YSQNWRYVFF VGIAPALLLL 
WIQKEVPESE LWQKQQTNKA PNAKLSSEHV RNAIVLLALN FFGLFAWWGL FTWIPPYLSL 
PVEQGGRGFS QLGTTGLLVF LNLVGMFPGY ISFGFFADRI GRRWSFFLYL FAAACVVPIY 
AAARQPWQIL VMGAVVAFFG TGFFSGSGIV GSELFPTHVR ARALGLTYNG ARMLSCVAPY 
VIGSLSMHRG LSGAFVVCAV GFLLAAFTAL LLPETRGREL AN