Gene Acid345_3318 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3318
Symbol
ID	4070280
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3932017
End bp	3932988
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	60%
IMG OID	637985340
Product	transglutaminase-like
Protein accession	YP_592393
Protein GI	94970345
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1305] Transglutaminase-like enzymes, putative cysteine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.695082
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACTACT CCATCCGACA CCTGACCAAG TTCTCTTACG CGTCGCCGGT CAGCGAAAGC 
ATCATGGAGA CGCGGATGCG TCCGCGCAGC GACAGCAACC AGCGCTGCCT GCTGTTCCAT 
TTGTCGGTGA GCCCGCGGTG CAGCGTGTTC TCGTTCCGGG ATCACATGGG GAACCACATC 
CACCACTTCG ATATTCCGGG AGCGCACTCG CAGTTGGTGA TCGTGGCGGA GGCAGTGGTG 
GAGCAGCAAG CGCCGGCGGC GCTGCCGGAT GCGCTGCCGT CGTCGGCTTG GGATGATTTG 
GATTCGGAAG TGGAGCGCGG TGATTTCTGG GAGATGCTGC TGCCGAGCGA GTTTGCGAAA 
CCGACGCCGC TGCTGCAGAA CCTCGCGGCG GAGTTGGAGG TTCGGCGCAA AGATGATCCG 
CTGAGCGTTC TACGCGGCTT GAATGAGCAA CTCTATCGCT ATTTCGAATA CGTTCCGAAG 
AGCACGCGGG TGGATTCGCC CATCGATGAC GCACTTGAAG CGCGATGCGG AGTTTGCCAG 
GATTTCGCGC ACATCATGAT TTCGCTGGTA CGGCCGTTGG GGATTCCATG CCGCTACGTC 
AGTGGCTATC TCAACAGCCG ATCCGAAGAT CACAACCGGT CGCCGGAGAC CGCAACGCAT 
GCGTGGGTGG AGGCTTTATT GCCTGGTGTT GGATGGGTCG GGTTTGATCC GACGAACAAT 
TTAATGGCCG GGGAACGGCA CATTCGGACG GCGATTGGGC GCGATTATTT CGACGTGCCT 
CCGACCAAGG GGGTGTTCAG CGGCGACAGC CCAAGTGAAC TATCGGTGGC GGTACGGGTG 
GCGGCTTCGA CGGCGCCTTC GGCACTGGAC GAGGATCAGC CTATTCCGGC AGATTGGGCG 
ATTCTCGTCG AAAAGGCGCA GGAGCCACCA CGGCCAACCG CGGCGTCGCA AACCCAACAG 
CAGCAGCAGT GA

Protein sequence

MYYSIRHLTK FSYASPVSES IMETRMRPRS DSNQRCLLFH LSVSPRCSVF SFRDHMGNHI 
HHFDIPGAHS QLVIVAEAVV EQQAPAALPD ALPSSAWDDL DSEVERGDFW EMLLPSEFAK 
PTPLLQNLAA ELEVRRKDDP LSVLRGLNEQ LYRYFEYVPK STRVDSPIDD ALEARCGVCQ 
DFAHIMISLV RPLGIPCRYV SGYLNSRSED HNRSPETATH AWVEALLPGV GWVGFDPTNN 
LMAGERHIRT AIGRDYFDVP PTKGVFSGDS PSELSVAVRV AASTAPSALD EDQPIPADWA 
ILVEKAQEPP RPTAASQTQQ QQQ