Gene Acid345_1474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1474
Symbol
ID	4069624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1782994
End bp	1784331
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	59%
IMG OID	637983483
Product	amino acid transporter
Protein accession	YP_590550
Protein GI	94968502
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.221068
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.529495
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCAAAG CCCAACAACT TGTCCGCAGC GTTGGCCTCT TCGACGCCAC GATGCTGGTG 
ATGGGCGGTA TCGTCGGCTC CGGCATCTTC ATCAATCCTT ACGTAGTTGC GCAACAGGTG 
CACACAGCAC CGCTAATCCT CGGTGCGTGG CTGGCAGGTG GCGTCATCGC TACGCTGGGT 
GCCTTCATCT ATGCCGAACT CGCGGGCCGG CAGCCCTCCG TGGGCGGCCA ATACGCCTAT 
CTCCGTGACG CCATCCACCC GCTCGCTGGC TTCCTTTACG GATGGGTCCT TCTGCTGGTG 
ATTCAGACCG GAGGCATGGC AGCCGTCACC GTGACCTTCG CGCGGTACTT CCTTGTTCTT 
ACCCATTGGG CCGTGCCAGA GAGAGTGGTT GCCGTCGTCA CGCTATCGCT CCTCACTCTG 
ATCAACTGCC TCGGTGTGAA GTTCGGAAGC CGGGTACAGA GTGCGCTCAT GATCCTGAAA 
ATCGGCGCGA TTGCATTTCT TGTCGTCGCC GGGTTTCTCT ACATTCGCGA GCCGTTTGCT 
GTCGGTGGAA CTGTACTCGA TCGCCCCCTC TCACCAGGCC TTCTATCTTC ATTTGGAGCC 
GCAATGGTCC CGGTGCTCTT CGCATTTGGT GGCTGGCAGA CGGCCAATTT CGTTGCCGGC 
GAAGTTCGCG ATCCGCGAAA GAATCTCGCG CGTGCCTTGC TCCTCGGCGT TGCTGGCGTG 
ATCGTCCTCT ATCTCGCCGT GAACTTCGTG TGCGTGCGTG CGCTCGGGCC TGTGGGACTA 
GCTGCCACCC GCGTACCCGC TACAGATGTC ATGCGTCTCG CGATGGCGCA GCGTGGCGCA 
ACGATCGTGA CGCTGGGTAT CACCGTCTCA ACCCTCGGCT TCCTAAGCCA ATCGATTCTC 
ACCGCTCCGC GCGTTTACTT TGCGATGGCC GAGGATGGCG TCTTCTTCCG CGCAGTAGCC 
AAAGTGAACG AAAAGACCCA CGTCCCCATT CTGGCAATCG TGCTGCAAAG CGTGTGGACG 
ATCGTTGTTG CGCTTACTGG CCGGTATGAA CAAATCCTGA ACTACGTTGT TTCGATGGAC 
TTCGTCTTCT TCGGACTGAC GGCTTGCACG CTGTTCGTAT TCCGAAAGCG CAGCTCCTTG 
GAAAACGGCG CCAGTGGCGG ATTTCAGGTG CCAGGCCATC CCTGGACCAC GCTCGTATTC 
ATCGCCGCCT CGTGGCTCGT GGTCACGAAT ACAATCTACA AGTATCCCGC GAACAGCCTT 
CTTGGCTTCG CGATTCTTCT CGTCGGCATG CCGGTGTATT GGCTGTGGCG ACGGAAAGGA 
AAAGTCCTCT CGCAATGA

Protein sequence

MSKAQQLVRS VGLFDATMLV MGGIVGSGIF INPYVVAQQV HTAPLILGAW LAGGVIATLG 
AFIYAELAGR QPSVGGQYAY LRDAIHPLAG FLYGWVLLLV IQTGGMAAVT VTFARYFLVL 
THWAVPERVV AVVTLSLLTL INCLGVKFGS RVQSALMILK IGAIAFLVVA GFLYIREPFA 
VGGTVLDRPL SPGLLSSFGA AMVPVLFAFG GWQTANFVAG EVRDPRKNLA RALLLGVAGV 
IVLYLAVNFV CVRALGPVGL AATRVPATDV MRLAMAQRGA TIVTLGITVS TLGFLSQSIL 
TAPRVYFAMA EDGVFFRAVA KVNEKTHVPI LAIVLQSVWT IVVALTGRYE QILNYVVSMD 
FVFFGLTACT LFVFRKRSSL ENGASGGFQV PGHPWTTLVF IAASWLVVTN TIYKYPANSL 
LGFAILLVGM PVYWLWRRKG KVLSQ