Gene Acid345_3114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3114
Symbol
ID	4070228
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3701019
End bp	3702359
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	61%
IMG OID	637985133
Product	amino acid transporter
Protein accession	YP_592189
Protein GI	94970141
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.988661
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAAA CCGCCGCGAA GACCGCGATG AAGCGCGCCA GCCTGCTGCC CTTCGTCTTC 
GTGATGTACT CGTACACCAC CGGCGGACCC TTCGGGCTCG AAGGCCAGGT CACCACCTCC 
GGCCCCGGCA TGACGCTCAT CTACCACCTG CTGCTCCCGT TTTTCTGGTG CATCCCGGTC 
TCGTTCGTCT CCGCTGAACT GACGACCGCG ATGCCCGTGG AAGGCGGCTT CTACCGCTGG 
TCCCGCGCGG CCTTCGGAGA CTTCTGGGGC TTCCTCGCCG GATGGTGGAA CTGGTGCGCG 
TCTTTCATTC TCGGCGGCGT GTACGCGGTC ATGTTCGCCG ACTACATGCA GTTCTATTTT 
CCGCAACTCA AAGCACCGCT GGCACACTTT GCGGTTGCGC TCGCGATGAT CATAGTCATC 
ACGTTCGTGA ACATCGTCGG CATTGATGCC GTCGGCAAAG TCGCTACTGT GTTTGGCGTA 
TTGATTCTCG CTCCCATCGC CGTCATGTGT GTGTGGGGCG CGACGAAGTG GCAGCACAAT 
CCATTCCTGC CATTGATTCC TCCGGGTGCG ACGCCGAAAC AAGTTGCCGG TGTCGGACTT 
GCCCTCGGCC TCTGGCTCTA CTCCGGTTTC GAACAGCTCT CGACGGTTGC AGAAGAAGTC 
GAAGACCCGC AGCGCACATT CCCACGCGCG CTCGCGTGGG CCGTGCCGAT GGCGATGGCC 
ACCTACTTCC TCCCCACGCT CTTCTCGCTC GCCGCAGTCG GCGATTGGCA CGCATGGAAA 
GACGGCTACT TCTCCACCGC CGCCTTCGCC ATCGGCGGAC ACTGGCTTGG CTTCGCCGTG 
AACCTCGCTG CGTTGATCAC TGCTGTCTCG CTGCTGAATG GCACCGTGAT CGCTTCCACG 
CGCATGCCCT TCGCCATGGC CGAAGACGGC TATCTCCCGC GTTTCCTGGC GAAAACCCAC 
GCACGCTTTA AAACGCCGTG GCTCGCGATT ATTTGCTCGG CCTGTGTTTA TGCGGCGCTC 
TCGTGGAAGA GTCTCTCGGC GCTCATCATT GTCTATTCGT GGCTGCGTGT TGCGACTACG 
TGGATGACCG TCATCGCCGC GTGGCGACTG CGCGCGAAAG ATCCGAACAT GAAGCGGCCC 
TTCCGCATTC CGTGGGGAAT CGCCGGTGTG GCGTATTGCG TGATTGCCCC GCTCATCATC 
GGCGCCATCG CGCTTTCGGC CAGCGAAAAT CCCATCGGCG GATTGCTCTC GCTCGCCCTC 
GGTCCTTTGA TGTATCCCGT AGTTAAGTTT TTTGCGCGCC GCGCCGCGCG CGCCGATCAA 
GCCGCAGCGG CCATTAGCTG A

Protein sequence

MSQTAAKTAM KRASLLPFVF VMYSYTTGGP FGLEGQVTTS GPGMTLIYHL LLPFFWCIPV 
SFVSAELTTA MPVEGGFYRW SRAAFGDFWG FLAGWWNWCA SFILGGVYAV MFADYMQFYF 
PQLKAPLAHF AVALAMIIVI TFVNIVGIDA VGKVATVFGV LILAPIAVMC VWGATKWQHN 
PFLPLIPPGA TPKQVAGVGL ALGLWLYSGF EQLSTVAEEV EDPQRTFPRA LAWAVPMAMA 
TYFLPTLFSL AAVGDWHAWK DGYFSTAAFA IGGHWLGFAV NLAALITAVS LLNGTVIAST 
RMPFAMAEDG YLPRFLAKTH ARFKTPWLAI ICSACVYAAL SWKSLSALII VYSWLRVATT 
WMTVIAAWRL RAKDPNMKRP FRIPWGIAGV AYCVIAPLII GAIALSASEN PIGGLLSLAL 
GPLMYPVVKF FARRAARADQ AAAAIS