Gene Acid345_2910 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2910
Symbol
ID	4071211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3455259
End bp	3456584
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	60%
IMG OID	637984928
Product	major facilitator transporter
Protein accession	YP_591985
Protein GI	94969937
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTTG TGGCGCAACG TTCCATAAAC CGCCCGCGGC CCATTCCATC GCTGCGCTGG 
TGGATAGGCG GGCTGCTGTT CGTTTCCACG GCGATCAACT ACCTCGACCG TCAGACCCTC 
TCGCTTCTCG CGCCTTACCT GAAATTGGAG TACCACTGGA CGAACACCGA CTACGCAAAC 
ATCGTGATCG CGTTCCGTAT TGCATACACT ATCGGCCAAA CCGCGTGCGG CCGCTTTGTG 
GATAAAGTCG GCACCCGACG CGGCCTCTCC ATCACGGTTG CGTGGTATTC GCTGGTATCG 
CTGCTGACTT CCTTCGCCCG CGGCTTCGCG AGCTTCGCGG GGTTCCGCTT CTTATTAGGA 
GCAGGCGAGG CCGCGAATTG GCCGGCCGCG ACCAAGGCCG TGTCTGAATG GTTTCCCGAG 
AAAGAACGCG CCTTGGCAAC CGCCCTGTTC GACAGCGGAT CGTCCATCGG CAGCGCGATT 
GCGCCTTTCG TTGTGCTTTC CATCTACTTC CGGTGGGGAT GGCGTCCGGC GTTCATGATT 
CCCGGCGCGC TCGGCTTTGT CTGGCTCATC GCGTGGCGAT ATTTGTACCA TCCACCGCAG 
CAACACCCTC GCGTGAGCGC AGCCGAGTTG CAGTACATCA CCGCCCCGGC GGGTGAGAGC 
GCAGCATCAA CGGACTTGCG CTCGCCACGC TGGCGCGAAT TGCTGAAGTT CCCGCAGACA 
TGGGCGATCA TTGTCGCCAA GAGCTTCACC GATCCCGTTT GGTTCTTCGT CACCGATTGG 
TTCCCGATCT ACCTGGTCGC GAAAGGCATC ACTCTGAAGA GCAGCCTGGT TGCGATTTGG 
ATTCCGTTCC TCGCAGCCGA CCTCGGCAAT TTTTTCGGCG GCGGAGTTTC GGGTTATCTC 
ATCCAGCGCG GATGGACTGT AGGCAAGGCC CGAAAAGCAC TCGTCGTCTT CGGCGGAATC 
GGCGTCCTCG CGCTCATTCC AACCGTCCTC ACGCAAAGTC TATTTGCGAT CTCCGGATTG 
TTCGCGATCG CCACCTTCTC ATACTCCGTG TTCTCCACGA TGGCAATCGT CCTGCCGTCC 
GACGTCTTCC ACAGCGACTC GGTTGCGACT GTCAGCGGCT TCAGCGGTTC GGGCGCAGGA 
ATCGGCACCA TCATCGCCTT CGAACTGGTC GGCCACTTCT CCGACGCGCG GAGCGCGCAG 
GGCGTCCACT CCTTCGATCC AATCCTGATT GTTGCCGGGA TGGTTCCCTT CGTCGGGATG 
CTGCTGGTGC TGGCTCTGCT GCGCAACAGC AAAGCAACGG AAGAGGGGTA CGCACGGCCG 
ATATAA

Protein sequence

MSVVAQRSIN RPRPIPSLRW WIGGLLFVST AINYLDRQTL SLLAPYLKLE YHWTNTDYAN 
IVIAFRIAYT IGQTACGRFV DKVGTRRGLS ITVAWYSLVS LLTSFARGFA SFAGFRFLLG 
AGEAANWPAA TKAVSEWFPE KERALATALF DSGSSIGSAI APFVVLSIYF RWGWRPAFMI 
PGALGFVWLI AWRYLYHPPQ QHPRVSAAEL QYITAPAGES AASTDLRSPR WRELLKFPQT 
WAIIVAKSFT DPVWFFVTDW FPIYLVAKGI TLKSSLVAIW IPFLAADLGN FFGGGVSGYL 
IQRGWTVGKA RKALVVFGGI GVLALIPTVL TQSLFAISGL FAIATFSYSV FSTMAIVLPS 
DVFHSDSVAT VSGFSGSGAG IGTIIAFELV GHFSDARSAQ GVHSFDPILI VAGMVPFVGM 
LLVLALLRNS KATEEGYARP I