Gene Acid345_2088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2088
Symbol
ID	4069687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2502135
End bp	2503451
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	60%
IMG OID	637984103
Product	sodium--dicarboxylate symporter
Protein accession	YP_591163
Protein GI	94969115
COG category	[C] Energy production and conversion
COG ID	[COG1301] Na+/H+-dicarboxylate symporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.403699
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.808142
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCATTTTC CCGCTGCCGT TCTGATGACA GCGCGCTGGC TGCTGGTAGC GGCGCTGTTG 
GTCCACGGAT GGTTCAAGCG CTCGCTGACG ACGTGGATTT TTGTTGCCAT GATTGTGGGT 
GCAGTCGCCG GCCACGATTT CCCGCAGATT GCCGACGATC GCCACGTCAA CGTCCGCGTG 
CTGGCGTTGA TTTTCCTTCG CCTGATTAAG ACGGTCATCG CTCCGCTGAT CTTCGCAACT 
CTCGTGGTCG GTATCGCTGG GCACAGCGAT ATGAAGGCCG TCGGTCGCAT GGGCATCAAA 
GCCATTGTCT TTTTCGAGGT GGTAACCACG CTTGCGCTGG TAATTGGGCT GTTCGCCATC 
AACGTGAGTA AGGCGGGCGT GGGAGCGCAA ATTCCGGTGA CCACGTCGGC GTCCGACCTC 
GCGGCGCAGA AGCTCACGGC TACCGACACG ATCCTCCACG TCTTCCCGGA GAACATTGCC 
AAGTCGATTG CCGAGGGGCA GGTGCTGCAG GTCGTCGTCT TCAGCGTGCT GTTTGGGATT 
GGCCTCGCCG GCGTACGCGA AGAGCGTCGT AAGACGATGC TGACTTTTTG TGAGTCGCTC 
GCCGAGGTGA TGTTCAAGTT CACCAACATC GTAATGCTGT TTGCACCGAT CGGCGTCGGC 
GCGGCGATTG CGTACACCGT GGGCCATACC GGGCTTGGCG TGTTAGTGAA TCTCGCTAAA 
TTGATTGCCG CGCTTTATGT GGCGCTGATC GTTTTCCTAG TCGGCGTGAT GCTGCCGGTG 
CTGTGGTGGA TGAAAGTGCC GATTCGCGCG TTTCTGAAGG CGATTGCGGA ACCGGCGACC 
ATCGCCTTCG GTACGGCGAG TTCTGAAGCG GCGCTACCGA GCGCGATGGA GTGCATGGAG 
GCGTTTGGCG TTCCGCGCAA AGTCGTCGCG TTCGTGATGC CGACCGGTTA CAGCTTCAAT 
CTCACGGGTA GCACGCTCTA TTTATCGCTG GCGGCGATCT TTGTGGCGCA GGCGAGCGGG 
ATCCATATGT CGATTGGCCA GCAATTGCTG CTGATGCTCA CGCTCATGCT CACGAGCAAA 
GGCGTCGCGG GCGTCTCGCG AGCGGCGATG GTGATCCTGC TGGCGACAGT TGGAACGTTT 
GGGCTACCCA TTGAACCGGT GTTTGTGCTG CTGGGAATCG ATCAGTTGAT GGACATGGGA 
CGCACCGCGG TGAACGTCAT TGGGAACTGC GTGGCGACTG TGGTGGTGGC GAAGTGGGAA 
GGCGAGATGC CGGTCGCTAT TCAGGCGTCT GGCATGCGGG ACGCCGTCCG CGATTAG

Protein sequence

MHFPAAVLMT ARWLLVAALL VHGWFKRSLT TWIFVAMIVG AVAGHDFPQI ADDRHVNVRV 
LALIFLRLIK TVIAPLIFAT LVVGIAGHSD MKAVGRMGIK AIVFFEVVTT LALVIGLFAI 
NVSKAGVGAQ IPVTTSASDL AAQKLTATDT ILHVFPENIA KSIAEGQVLQ VVVFSVLFGI 
GLAGVREERR KTMLTFCESL AEVMFKFTNI VMLFAPIGVG AAIAYTVGHT GLGVLVNLAK 
LIAALYVALI VFLVGVMLPV LWWMKVPIRA FLKAIAEPAT IAFGTASSEA ALPSAMECME 
AFGVPRKVVA FVMPTGYSFN LTGSTLYLSL AAIFVAQASG IHMSIGQQLL LMLTLMLTSK 
GVAGVSRAAM VILLATVGTF GLPIEPVFVL LGIDQLMDMG RTAVNVIGNC VATVVVAKWE 
GEMPVAIQAS GMRDAVRD