Gene Acid345_2643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2643
Symbol
ID	4072052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3117398
End bp	3118597
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	60%
IMG OID	637984660
Product	major facilitator transporter
Protein accession	YP_591718
Protein GI	94969670
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.238963
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTTTCAC TTCCGGCCTT CCGCACGATC TGGATGGGGC AATTCGTCAG CATCTTTGGC 
GATTTCGTCG CGATCTTCGC AGTCGTCAGC ATGATTACGT TTCGCTGGCA CGGCTCGGCG 
ACGCAAGTGA CCATTGCGAT TACGCTCGCC CTCGTGCCGC TGGCAATAAT CGGGCCTCCG 
GCGGGCGTTC TCGTGGACCA CTGGAACGTG AAGCGGGTGA TGATTGGCAG CGACCTGTCG 
CGAGCGGTGA TCGCCGTCCT TCTGGCGTGG ATGACGAACT CCTGGCAGAT CGGCATGGTG 
TTGTTCGCAC TGGGTTGCGC GTCGAGTCTG TTCGTGCCGG CGCAGTCGAT TGCGGTGCGG 
ACGCTGATTC CGCGCGAGCG CTTGTTGCAA GCGAATGCCA TGCTGATGCA GGCGTTTTAC 
CTGATCCGCA TTATTTCGCC GCTGGTAGCG GCGGCTATTG TGAGCGCGCT CTCGGAGAAG 
GCGTGTTTCT ACATTGATTC GGGAAGCTTC GTGTTCTCGG CGCTAATGAT TGCGACGCTA 
ACGATTCATC GTCCACCGCG CGAGGGCGCG GATAAGACAC TAAGCGGTTT GAGCAAGGAT 
TTCGCGGAAG GGAACCGGTT CATCTTCACC CATCCGGGAC TGTCGTTTGT GTTCCTCGCC 
ATGGCGATTG CGATGTTCGT GATGAGCTCG TTCATGCCGC TGATATCGAT CTTTGTGCGC 
GATGTGCTGC ACGGAGCAAC GCGGACCTAC GGCGTGGTGA GCTCGTGCGT CGGGTTCGGC 
ATGATTCTCG GCACCACGCT GGTGACGAAG ATCTCGCGAG GCAAGGCGCG GCCGGGCGTG 
GTGGTGATGG GCCTGCTATC GCTGGGAGTA GCGACGGCGG TGCTGGCGAC TTCGCGAATT 
CCGTTCCAGG CGGGCGTGAG CACTTTTCTC ATGGGCTTCT CGATTGCAAT GGTGCTCATT 
CCGGCGCAGA CGATGTCGCA ACAGGAAACG CCGCCGCAGA TGGTAGGCCG CGTGAGCAGC 
ACGTTCATGT CGATGATCTC GATTGCGCAG GTGTTCGGGT TGCTCCTTAG CGGCTCGGCG 
GCGCAACGGC TCGGGATGCA GCGGCTGTTT GCCGTGTGTT CGGCAGTACT GGTGGTCATT 
GCCGCGGCAG GCTGGATGTT TTTACGCAGC CGCCGGCAAC CGGAAGCAGC AGCTGCTTAG

Protein sequence

MFSLPAFRTI WMGQFVSIFG DFVAIFAVVS MITFRWHGSA TQVTIAITLA LVPLAIIGPP 
AGVLVDHWNV KRVMIGSDLS RAVIAVLLAW MTNSWQIGMV LFALGCASSL FVPAQSIAVR 
TLIPRERLLQ ANAMLMQAFY LIRIISPLVA AAIVSALSEK ACFYIDSGSF VFSALMIATL 
TIHRPPREGA DKTLSGLSKD FAEGNRFIFT HPGLSFVFLA MAIAMFVMSS FMPLISIFVR 
DVLHGATRTY GVVSSCVGFG MILGTTLVTK ISRGKARPGV VVMGLLSLGV ATAVLATSRI 
PFQAGVSTFL MGFSIAMVLI PAQTMSQQET PPQMVGRVSS TFMSMISIAQ VFGLLLSGSA 
AQRLGMQRLF AVCSAVLVVI AAAGWMFLRS RRQPEAAAA