Gene Acid345_3742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3742
Symbol
ID	4069317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4416133
End bp	4417089
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	57%
IMG OID	637985764
Product	Zn-dependent hydrolases
Protein accession	YP_592816
Protein GI	94970768
COG category	[R] General function prediction only
COG ID	[COG0491] Zn-dependent hydrolases, including glyoxylases
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.443834
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAGCG GAATGCGTCG CGAATTTTCT CGTCGCCAGT TTCTCGTGGG AGGCGCAATC 
GCAGTGGCGG CTGCCTACGT TGCTCCAATG CGGCTATTTG GAAACGCAGA CGATTTGGTG 
GAAGGTGCCA TCAAGCAGTC GGCCACGGCG AAGATAGAGG TCCAGACCCT CCGGCGCAAT 
GTGAGTGTTC TTCTGGGGCC GGGCGGGAAC ATCGCGGTAC TTGCTGGGTC AGACGGGAAG 
ATACTTGTCG ATGCGGAGAT CGTGAGCGCG CGGCGTCAAG TCTCTGCGGC TCTCGCGAGC 
ATTAGCAAAG ATCCCATTCG GCAACTGATC AATACTCATT GGCATTTTGA TCACACGGGC 
GGCAACGAGT GGTTGCATGA GGCTGGAGCT AGCATCCTGG CACAGGAGAA CACGCGCAAA 
CATCTCTTGC GAGACACGCG AGTGGACGGC TGGAATCATA CTTTCCTGAA AGCGCCGGCC 
GGCGCGATTC CGTCCGAGGT TTTCCAGGAG AAACATACGC TCCATGTGAA CAGCAGCACC 
ATGGAACTCA GGCACTATCT ACCTGCCCAC ACCGATTCCG ACATCTCCGT GCACTTCACA 
GAGGCTGACA TCTTCCACGC GGGCGATACC TTCTGGAACC GTTCATATCC TTTCATCGAC 
TACTCGACTG GAGGCAGCAT CGACGGACAG ATCCGCGCGG CGGAAGAGAA CCTGTCCAAA 
GTGAGTAGAG ATACGATCAT CGTTCCCGGG CATGGCGCAG TGTCTGGAAG ATCCGATCTT 
GCTTTGTTCC GCGATGTACT CGTCGAGATG CGCGAGAAGG TGGCAGTTTT CAAGAGACAG 
GGGCGGACGC TGAGCGAAGT GATCGACGCC AAACCGGGAG CTCGCTATGA CGAGGAGTGG 
GGGCAATCTT TCATGAGCCC AAGTGCGTTC GTCGCGTTGG TCTACCAAGG TGTCTGA

Protein sequence

MISGMRREFS RRQFLVGGAI AVAAAYVAPM RLFGNADDLV EGAIKQSATA KIEVQTLRRN 
VSVLLGPGGN IAVLAGSDGK ILVDAEIVSA RRQVSAALAS ISKDPIRQLI NTHWHFDHTG 
GNEWLHEAGA SILAQENTRK HLLRDTRVDG WNHTFLKAPA GAIPSEVFQE KHTLHVNSST 
MELRHYLPAH TDSDISVHFT EADIFHAGDT FWNRSYPFID YSTGGSIDGQ IRAAEENLSK 
VSRDTIIVPG HGAVSGRSDL ALFRDVLVEM REKVAVFKRQ GRTLSEVIDA KPGARYDEEW 
GQSFMSPSAF VALVYQGV