Gene Acid345_3034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3034
Symbol
ID	4071941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3600303
End bp	3601601
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	59%
IMG OID	637985053
Product	major facilitator transporter
Protein accession	YP_592109
Protein GI	94970061
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.201695
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAATCG CGGCTCTCTC CATGACAACC ATACCGTCAG AGCACAAGCG GCTCCCGGGG 
TTTCTTATTG TCCTGCTGGT GTTGATTGGC GTCAGCGTTT TTATCAACTA CATCGACCGC 
GGCAACCTGT CGATTGCAGC TTCGATGGTG CAGGACGAAA TGCATATCAA CCCCGCGCAA 
CTGGGCGTGC TGCTTTCGGC CTTCTTCTGG ACCTACGCTT TGCTACAGCC TTTGTATGGC 
TGGCTGGCGG ACCGCGTAAA TGTGTATTAC TTGTTCGCGG TCTGTTTCGC GGCGTGGTCC 
GTGGCCACAG CGGCAACCGG CCTGGTGCAC ACGTTCGTTG CCTTATTCGC GTTGCGGCTG 
ATTGTCGGGA TGGGGGAAGC GGTGTCGTTC CCGGCGTACT CGAAGATCAT TGCCTTGAAT 
TATCCAGAAG AACATCGCGG CGTGGCGAAC AGCGTGCTCG CCATGGGGTT GGCGGTTGGT 
CCGGGATTCG GGATACTGCT CGGCGGCACC CTGATGGCGC GGTTCGGATG GCGGCCATTC 
TTCATCATCC TCGGCTTGGG CAGCATGCTC TGGATTCCTC TGTGGTTAAA GTGGTCGCCG 
AGCAGGAACC TCGTTCCTGC ATCCAGCAAA CAATCTTCGC CAAGCTTGCT GGAGTTTGTC 
TGCCTGCGTT CGGCGTGGGG AAGTTGTATC GGACTGTTTT GCGGCAACTA TGTGAACTAC 
TTCCTGCTCA CCTGGCTGCC GTACTACCTG TTGCGCGAGC GGCATTTTTC GATGGCGCAG 
ATGGCGCGCA TCGGAGCAAC CGGTTACTTC GGTGGAGCGG TGTGTGCGGG AATCGCGGGT 
TGGCTCTCGG ACCGGTGGAT ACGGTCCGGT GCAACGACGA CCGTTGTCCG AAAAACCTTC 
GTTGCCGGCG GCTATGTGTC GTGTGCCACC TTTCTCGCTC TCGCTGCCTT CGTTCCGGGC 
GCGCGCGGAT CCACGATTCT GTTGTGGCTA GCCATGGCGA GCTTCGGTGT GAGCGCCTCC 
AATATCTGGG CGATCCCGCA GACGCTCGCG GGCTCGCAAG CCGCTGGACG CTGGGTGGGA 
TTCCAGAATT GCTCTGGAAA TATGGCTGGC GTCGTAGTGC CTGTAGTAAC TGGATTCGTG 
GTGCGACAGA CGGGAAGCTT CCGCTCGGCC TTCGTATCGG TGGCAGTCGT TCTGTGCATC 
GGCGCAGCTA CATGGACGTT CGTCGTAGGG AAGATCGAAC AGGTGAAATG GGAACGATCG 
GCGGAATTAC TCGTGGCCGA AGCTTCAGCG TCGCGTTGA

Protein sequence

MRIAALSMTT IPSEHKRLPG FLIVLLVLIG VSVFINYIDR GNLSIAASMV QDEMHINPAQ 
LGVLLSAFFW TYALLQPLYG WLADRVNVYY LFAVCFAAWS VATAATGLVH TFVALFALRL 
IVGMGEAVSF PAYSKIIALN YPEEHRGVAN SVLAMGLAVG PGFGILLGGT LMARFGWRPF 
FIILGLGSML WIPLWLKWSP SRNLVPASSK QSSPSLLEFV CLRSAWGSCI GLFCGNYVNY 
FLLTWLPYYL LRERHFSMAQ MARIGATGYF GGAVCAGIAG WLSDRWIRSG ATTTVVRKTF 
VAGGYVSCAT FLALAAFVPG ARGSTILLWL AMASFGVSAS NIWAIPQTLA GSQAAGRWVG 
FQNCSGNMAG VVVPVVTGFV VRQTGSFRSA FVSVAVVLCI GAATWTFVVG KIEQVKWERS 
AELLVAEASA SR