Gene Acid345_4206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4206
Symbol
ID	4072165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4983534
End bp	4985006
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	57%
IMG OID	637986237
Product	Na+/solute symporter
Protein accession	YP_593280
Protein GI	94971232
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.153775
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0109856
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAACC TAATTTATGC CGTGGTACTG GGCATTATCG TTGTCGCGTT GCTGGCCGTC 
AGCCTCTCGC AGCTTCGCAA GGTAAAAACA AAAGCAGATT ACCTCGTCGC TGGACGATCG 
CTCCCGGCAT ATGTGCTGGT GGCGACACTG CTGTCGTCGT GGATCGGTGC GGGCAGCCTG 
TTCGCAGGCG CTGAAAATGC ATTCCGCAAT GGCTTCGCAG GACTATGGCA GTCTGCCGGC 
GGATGGTTCG GGCTGCTGGT TATTTACTTC GTGGCACCAC GCGCCCGAAA GTTCGCGCAG 
TACACCATTC CCGACCTCAT CGAAACGCGC TACAACACCA CAGCCCGCGT GCTTTCAACG 
ATTGCGATCC TCTTTGCGTA CACGGCGATC ACTTCGTATC AATTCCGCGC GGGCGGGAAC 
ATCCTTCACC TGATCTTCCC TGAAGTGAAC CACGAGGTCG GGACGTACAT CATCGCTGTA 
TTTGTGATTG CGTTCACGGC GGTCGCAGGC ATGGCGTCCG TTGCTTACAT GGATGTGGTC 
ATAGGAGTGT TGATCACGGT GATTGGATTC ATCGCTGCCC CGGTGCTGCT CAACCGCGCT 
GGCGGTTGGG CCGGATTGCA CCAGGTGCTT CCCGCAACCC ACTTCACACT GCTCGGTGAG 
TTCGGCTACG TAGACGGGCA ATCGCAGGGA ACGCTCGCTG GATTGCTGAA AGCCTTTGAG 
TATTTCCTGC CGACGTGCCT CCTCATGCTC GGCAACCAGA GCATGTACCA GAAGTTCTTC 
TCGGCAAAGT CGGAGAAAGA CGCGCGACAA GCCGTCGTCG GATGGGTCTT CGGGACGTTT 
ATTCTTGAGA CCCTGATCGC TGCCATCGCT GTGTTTGGGT CGGCGATTGT GTGGGTGCAG 
TATCACCAGC ACCAGGTTGA CCTGGAGCCG CATAACATCA TCCCGTATTC GGCGCTGCAC 
TTTCTGCCGA GAGTTGTGGG CGCACTGCTG ATGGGAGCGG TGTTCGCGAA GGTAATCTCG 
ACCGCGAATA ATTATCTCTT CTCGCCGTCG ACGAACTTGA TCAACGACAT CTACACGCGG 
TTCATCAACA AAGAAGCCTC CAACAAAAAC ATTCTGTTTG TTTCTCGCTT TCTCGTCTTA 
GGGTTAGGCG TGTGGGCACT GGTGCAGGCG GTGCATCTGA CGTCGGTGCT GGAGAAGGCG 
ATGTATGCCT ACACGATCTA CTCGGCGGCG ATAACGCCGG TGGTGTTGGC CGCGTTCTAC 
TCGAAGCGTG TGACCGCACC GGCAGCGGTC ACTTCAATTG CGCTTGGGAC AGCGGTGACG 
GTGTTCTGGG ACCTCGGCAA GAACTTGCTG CCTCCGGCGC TCGCTCAGCG CGATGCAATT 
TTCCCGGCAC TTGTCGTTTC GCTGCTCTCG TTGCTGCTTG TGACCCTTGT AACTCCGCCA 
CCATCGAAGG AGCAACTCGC GCCTTTCTCC TAG

Protein sequence

MSNLIYAVVL GIIVVALLAV SLSQLRKVKT KADYLVAGRS LPAYVLVATL LSSWIGAGSL 
FAGAENAFRN GFAGLWQSAG GWFGLLVIYF VAPRARKFAQ YTIPDLIETR YNTTARVLST 
IAILFAYTAI TSYQFRAGGN ILHLIFPEVN HEVGTYIIAV FVIAFTAVAG MASVAYMDVV 
IGVLITVIGF IAAPVLLNRA GGWAGLHQVL PATHFTLLGE FGYVDGQSQG TLAGLLKAFE 
YFLPTCLLML GNQSMYQKFF SAKSEKDARQ AVVGWVFGTF ILETLIAAIA VFGSAIVWVQ 
YHQHQVDLEP HNIIPYSALH FLPRVVGALL MGAVFAKVIS TANNYLFSPS TNLINDIYTR 
FINKEASNKN ILFVSRFLVL GLGVWALVQA VHLTSVLEKA MYAYTIYSAA ITPVVLAAFY 
SKRVTAPAAV TSIALGTAVT VFWDLGKNLL PPALAQRDAI FPALVVSLLS LLLVTLVTPP 
PSKEQLAPFS