Gene Acid345_3351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3351
Symbol
ID	4071269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3974905
End bp	3976362
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	60%
IMG OID	637985373
Product	amino acid transporter
Protein accession	YP_592426
Protein GI	94970378
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGAGGCAA TCATCAGCCC GACGCCGAAA TCAGCGCCGA GTAACACTCC GCAACTGGCG 
CGCGACCTGC GCGTAAGCCA CGCCACCGCC GTCGTCGTCG GCACCATCAT CGGCAGCGGC 
ATTTTCCTCG TACCCGCCGA GATGATGCGC GCCGTCGGCA CCGCGAAGCT CGTCTATCTC 
GCATGGATCG TCGGTGGCAT CCTGTCGTTC CTAGGCGCGC TGACGTATGC AGAACTCGGC 
GCGATGAAGC CGCAATCCGG CGGCGAATAT GTGTACGTGC GCGATGCCTA CGGCCCGCTG 
ATGAGCTTCC TCTATGCGTG GTCATGGTTC GTCATCGCGA AGCCCGGCTC CATGGCGACC 
ATCGCAACCG GCATGATGCA GATTCTTGGC GGCTATCCCG CGCTGTCGTT CCTGCCAAAA 
AACGTCGTCT CGGGAGTGCC ATTCACCTAC GCGCAGCTGG CGGCCGTAGC GCTCATCATT 
TTCATCTCGG CCGTGAACTA CATCGGCGTG AAGAAAGCCG GACAGTTCCA GGTAGTCTTC 
ACCGTCCTGA AGCTCGCAAT CATCTTCGGC GTGATTGTCG TTGGTTTCTT CGCGGGCCAC 
GGCTCGTGGT CGAACTTTAC AACCAGCTTC ACGGGTGCGA CTGGCGGCAT TGCCGGCTTC 
ATGATCGCGC TCGTTGCCGC GCTCTGGGCG TATGACGGCT GGAACGACAT CAACATGGTC 
GCCGAGGAAA TCGACCACCC CGAGCGCAAC GTGCCGATCG CGCTGATTGT CGGCGTGGGC 
ATCGTGGCAG CGTTGTACAT GCTCCTCAAC GCCGCAGTGC AATATGCGCT TCCAGCGCAG 
GCCATCGCGA TGTCGAAGCG CGCGGCATCG GATGCAGTCC TGGTCTCAAT TGGCGCAGGC 
GCGGCCTCGA TATTCGCGGC ACTCATGGCG ATCCAGATGT TGGCAACGAT CAACGGCACC 
ACGCTCAGCG GCGCAAGAAT TCCGTATGCC CTGGCGCGCG ACGGCTATTT CTTCGAGGCC 
ATCGGCAAAG TGCATCCGCG CTACCTCACG CCTGCAAATG CGATCGTCTT CCAGGGAGCG 
CTGGCGGTCA TTCTCGTGTC GCTGGTCGGG AAATTCCAGC AGCTGTTCTC GTTAACAATC 
TTCGCCGAGT GGCTGTTCTA CATGATCGCG ACGAGCACCG TCTTCGTCTT CCGGCGGCGC 
GAGCCGAACG CGAATCGTCC CTACAAAACG TGGGGATATC CCGTCGTTCC CGCAGTCTTC 
ATCGCTGCAG CCGCGATGCT GCTCTGCTAC ACCTTCGTCG ACAACCTGAA GTACGCCATG 
ATTCCCACGA CGTTGATCGG TCCGCCGTTG AATTCAATTT CTACCGGCGG CGCGCTGGTA 
ATTCTGCTCG GCGTGCCGGT GTTCTGGTGG TTCGCAAGGC AAAAATCTTT AACCACGAAG 
GGCACGAAGG AATTGTAG

Protein sequence

MEAIISPTPK SAPSNTPQLA RDLRVSHATA VVVGTIIGSG IFLVPAEMMR AVGTAKLVYL 
AWIVGGILSF LGALTYAELG AMKPQSGGEY VYVRDAYGPL MSFLYAWSWF VIAKPGSMAT 
IATGMMQILG GYPALSFLPK NVVSGVPFTY AQLAAVALII FISAVNYIGV KKAGQFQVVF 
TVLKLAIIFG VIVVGFFAGH GSWSNFTTSF TGATGGIAGF MIALVAALWA YDGWNDINMV 
AEEIDHPERN VPIALIVGVG IVAALYMLLN AAVQYALPAQ AIAMSKRAAS DAVLVSIGAG 
AASIFAALMA IQMLATINGT TLSGARIPYA LARDGYFFEA IGKVHPRYLT PANAIVFQGA 
LAVILVSLVG KFQQLFSLTI FAEWLFYMIA TSTVFVFRRR EPNANRPYKT WGYPVVPAVF 
IAAAAMLLCY TFVDNLKYAM IPTTLIGPPL NSISTGGALV ILLGVPVFWW FARQKSLTTK 
GTKEL