Gene Acid345_3333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3333
Symbol
ID	4070295
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3951418
End bp	3952860
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	61%
IMG OID	637985355
Product	amino acid transporter
Protein accession	YP_592408
Protein GI	94970360
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.326771
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACA CTGAGCGCTC GCAGCATGAT GACGAGCACC TCGTCCGCGG GCTGAGCCTG 
GGCGGCGCGA CTGCGCTCAA TATGATCGAC GTGATCGGCA TTGGGCCGTT CATCACGATC 
CCGCTGATCA TCAGTGCCAT GGGCGGCCCG CAGGCGATGC TGGGCTGGAT CTTCGGCGCG 
CTGCTCTCGC TTTGCGACGG CCTCTGCTGG GCCGAACTCG GCGCCGCCAT GCCGGGCTCC 
GGCGGCAGCT ATCGCTACCT CAACGAAATT TACGGTCGCC AGAAATGGGG ACGCCTGCTC 
TCGTTCCTCT TCATCTGGCA GCTCTCGTTC TCGGCGCCGC TTTCCATCGC ATCAGGATGT 
ATTGGCTTCT CGCAGTATGC GAGCTACTTG AAGCCGAGCC TCGAACACGC ATGGATCTCG 
CATCCGCGCT TCATGGTTGG GCCGGTGACG GTGATGTCGA TTGCGACGGT CATCGTGGTC 
GTCTTCCTGC TCTATCGCGG CGTAGTGCAG ATCGAAAAGA TCTCGAAATT TCTCTGGGTC 
GGCGTGATGG GAACCATGGC GTGGATCATC TTCGCCGGGC TCACCCACTT CCAGCCGTCG 
CGCGCGTTCG ATTTTCCGCC GGGCGCGTTT ACGCTCTCGC ACAATTTCTT TCTCGGTCTT 
GGCGCGGCGA TGCTGATCGC TACCTACGAT TTCTGGGGCT ACTACAACAT CGCGTTTCTT 
GGCGGCGAGG TACGCGACCC GGAGCGCAAT ATCCCGCGCG CGATGCTGTA TTCCATCGTG 
ATTGTCGGCG TGCTCTACGT GGTGATGAAC ATCAGCATCC TCGGCGTGAT GCCGTGGCGC 
GAGTTGGCGC AGACCGCGCA ATCGAACACG CGGTATTACA TCGTCGCGAC CATGATGGAG 
CGCCTCTACG GCCACTGGGC CGGGGTGCTG GTGGCGCTGC TCATCATGTG GACGGCGTTT 
GCCTCGGTGT TCTCGCTACT GCTGGGCTAT TCACGCGTTC CCTACGCGGC AGCGCGCGAT 
GGCAACTACT TCAAGCCCTT TGCGCGCATC CATCCCACGC AGAAGTTTCC GACCGTGTCG 
TTGCTGGTGC TGGGTGGCGT GGCGATTCTT TGCTGCTTCC TGCGACTAGC CGATGTCATC 
GCGGCGCTGG TGGTGATTCG CATCCTGCTG CAGTTCGTGG TGCAGATCCT CGGGCTGCTG 
TATTGGCGTT GGTCGCGGCC CGATGCGCCT CGTCCCTTCA AGATGTGGAT TTATCCCGTT 
CCCGCAGTGC TGGCGCTGGT GGGCTTTATT TATGTACTAT TCGTGCGCAC CAATTCCTGG 
CAACAAGTTC GCTATGCAGT CGTAATCGTT GTCATCGGTC TCGCCATCTA TCTTGTGCGC 
GCCTGGCGCA GGGGCGAATG GCCGATGCCG GGAAGATCCG CGGCCAGCGA TGTCGCGGTG 
TAA

Protein sequence

MSNTERSQHD DEHLVRGLSL GGATALNMID VIGIGPFITI PLIISAMGGP QAMLGWIFGA 
LLSLCDGLCW AELGAAMPGS GGSYRYLNEI YGRQKWGRLL SFLFIWQLSF SAPLSIASGC 
IGFSQYASYL KPSLEHAWIS HPRFMVGPVT VMSIATVIVV VFLLYRGVVQ IEKISKFLWV 
GVMGTMAWII FAGLTHFQPS RAFDFPPGAF TLSHNFFLGL GAAMLIATYD FWGYYNIAFL 
GGEVRDPERN IPRAMLYSIV IVGVLYVVMN ISILGVMPWR ELAQTAQSNT RYYIVATMME 
RLYGHWAGVL VALLIMWTAF ASVFSLLLGY SRVPYAAARD GNYFKPFARI HPTQKFPTVS 
LLVLGGVAIL CCFLRLADVI AALVVIRILL QFVVQILGLL YWRWSRPDAP RPFKMWIYPV 
PAVLALVGFI YVLFVRTNSW QQVRYAVVIV VIGLAIYLVR AWRRGEWPMP GRSAASDVAV