Gene Acid345_3994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3994
Symbol
ID	4071130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4724034
End bp	4724990
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	59%
IMG OID	637986021
Product	DMT family permease
Protein accession	YP_593068
Protein GI	94971020
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGAAG TCCAGAGCCG GCATCGCCTG CAAGTGATCC TCGCCTTTGG GTTGGTGTAT 
GTGTTCTGGG GCTCCACGTA TCTAGCCATC GGCATCGCCG ACGACGAAAA AATCCCCGCC 
GCCGCCATCT GTGCCATGCG CTTCCTGATA GCGGGCACGC TCATGCTCGG CGCCTGCGCC 
CTGATGCGAA AGAAGATTCG CGTTTCCTGG GAGGAGTTTG GTCGTCTCGC GATGGTTGGC 
TTCCTGCTGC TGGTGTGCGG CAATACAGGT TTGACGTGGG CAGAGAAGTA TGTAGCAACG 
GGCTTCGCAT CGTTGATCGT CGCGATCACA CCGATCTGGA TCTTTTGTCT TGAGAGCTTC 
GTCTACAAGG GAGACAAGAC TTCGGGGCGG GGAATCATCG GACTTGCGCT GGGCGTAGTG 
GGCACGGGCG TGCTTTTCTG GCCGAAGCTC ATGAATCCCG AAATCCGCGG TGGCATGCAG 
TTGCTTGGTG CCGTCAGCCT GCTCGGTTCA TCGTTCTGTT GGGCGAATGG TACGGTGCTT 
TCGCGCCGCT GGAAATCGAA GTTCACCGTG GATCCGATTA CCGCGACGGC CTACGAGATG 
ATTGTCGCGG GCACCGTGAA CCTGTGCATC AGCCTTGCAC TGCGCCAACA CAACATTCGA 
TGGACCCACC GCGGCGTTGG CGCAATTCTC TATCTTGTCG TCTTCGGATC GTGGGTCGGA 
TTCACTGCTT ACATCTGGCT GCTAAAGCAC GTGCCGACGC CCAAGGTCGC CACCTACGCG 
TACGTGAACC CGATTGTCGC TGTCTTTCTC GGCTGGGCGG TGCTGCACGA GACCATCGAC 
CGGTACATCG TCGCGGGTTC GGTCGTGATT GTGGCCGCGG TCGCGATGGT CACCATTGCG 
AAGGTGAAAT CCGCACCCGC GGTTCAGATG GTCGAAGTGG AAACCACTGG CGATTAA

Protein sequence

MTEVQSRHRL QVILAFGLVY VFWGSTYLAI GIADDEKIPA AAICAMRFLI AGTLMLGACA 
LMRKKIRVSW EEFGRLAMVG FLLLVCGNTG LTWAEKYVAT GFASLIVAIT PIWIFCLESF 
VYKGDKTSGR GIIGLALGVV GTGVLFWPKL MNPEIRGGMQ LLGAVSLLGS SFCWANGTVL 
SRRWKSKFTV DPITATAYEM IVAGTVNLCI SLALRQHNIR WTHRGVGAIL YLVVFGSWVG 
FTAYIWLLKH VPTPKVATYA YVNPIVAVFL GWAVLHETID RYIVAGSVVI VAAVAMVTIA 
KVKSAPAVQM VEVETTGD