Gene Acid345_3406 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3406
Symbol
ID	4072742
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4027354
End bp	4028802
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	61%
IMG OID	637985428
Product	hypothetical protein
Protein accession	YP_592481
Protein GI	94970433
COG category	[R] General function prediction only
COG ID	[COG4373] Mu-like prophage FluMu protein gp28
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.662335
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATCAC AGCAGCGTGA GATCGAGAGG ACGGCAAGCA AGGCCCTGGT AAAGCTTTAT 
CCCTATCAGG TGCGCTGGAT CCTCGACGAG GGACGTTTCA AGCTCATTGT GAAGGGTCGC 
CAAACCGGCC TGAGCTTCGG AACCTCGCTG CGCCACGTTC GCCGCCGCAT AAAGACCCGA 
GGCGACACGA TCTGGATCTC CGCATCTGAC CGCCAGTCGC GCGAGTCGAT CGAATATTGC 
AAAACTCATG CGAAGGCCGT TGGGGAAGCG TTCGACTTCG CCGAGATCGC GTTTCCCGGT 
ACCGACGACA AGGCCCAGCA GATCACGTTT CTGCACAATG GCGCGCGGAT CATCGGTCTT 
CCGGCGAACC CGGATACCGT TCGCGGCTAC CACGGTGATG TTGTCCTGGA CGAGTTCGGC 
TTCCATCGCG ACGCGAAGAA AATTTACAAG GCTGCGATCG CGATCGCATC GCGCGGCTAT 
CAGCTCGAAG TGATCTCCAC GCCGAACGAA CAGGCGGGCA AATTTTGGGA GATCGCAAAA 
GCTGCCGGCG TTCCCGCCGA TGGCGGCTCC GAGCGCACGC ATTGGACGAA GGGTGTCTGG 
TCGGTGCACT GGCTCGACAT CTACACGGCG GTGAAGGAAG GCTGCCCGAT CGACGTCGAG 
GTTATGCGCC AGGCGTGCTA CGACGACGAC ACCTGGCAGC AGGAATACTG CTGCGTATTC 
CTTGCCGACG CGCAGAACTA CATCCCGATG GAATTGATCA TCGCGGCTGA GAGCCAGATG 
GCTTCGCTCG ATGCGCGCCC GGAGGACCTC GCCGGCCGCG AGCTTTACCT GGGCATGGAT 
ATCGGCCGCA AGAAAGATCG CACCGTGATC TGGATCGACG AGAAGCTTGG CGATGTCATG 
ATCACGCGTG CCGTCGAGAC GCTCGAACGC ACGCCGTTCG CGAAGCAATT TGAGCAGGCC 
GCCGCGTGGA TGCCGTATGT GCGTCGCGGT TGCATCGATT CGACGGGCAT CGGCGCGCAG 
ATCGGTGAGG ATCTAGAGCG CAAGTTCGGC GCCGCGAAAG TCGAGAAGGT CGAGTTCAAC 
ATCGCCAACA AAGAAACGAT GGCTGGACTC GCAAAGCGCA AGCTTGAAGA TCGTCAGGCG 
CGGATCCCGG AGTCGCCGTC GATTCGCCGG GCGATCAACG CAGTAAAGCG CTACACCTCG 
CCGACCGGAC ATTTCCGCTT CGACGCCGAT CGCACTGAGG CTGGCCACGC CGACGAATTC 
TGGGCTTTCG CACTCTGTTT GTCGGCCGCT GAAGGCGGAT CCTCGCCCGC GCTGGCCTCG 
ATCGACACCG ATACCTCTCT CAACCGCGCG CGCAACGGTG TGGATGAAGA CCTGGTTGCA 
GCCGGCGCGC GGCGTGAGCG TGGCGATTAC ATGATGGGCG CGCGCAATCG GGATCGGAGG 
GTCTGGTGA

Protein sequence

MASQQREIER TASKALVKLY PYQVRWILDE GRFKLIVKGR QTGLSFGTSL RHVRRRIKTR 
GDTIWISASD RQSRESIEYC KTHAKAVGEA FDFAEIAFPG TDDKAQQITF LHNGARIIGL 
PANPDTVRGY HGDVVLDEFG FHRDAKKIYK AAIAIASRGY QLEVISTPNE QAGKFWEIAK 
AAGVPADGGS ERTHWTKGVW SVHWLDIYTA VKEGCPIDVE VMRQACYDDD TWQQEYCCVF 
LADAQNYIPM ELIIAAESQM ASLDARPEDL AGRELYLGMD IGRKKDRTVI WIDEKLGDVM 
ITRAVETLER TPFAKQFEQA AAWMPYVRRG CIDSTGIGAQ IGEDLERKFG AAKVEKVEFN 
IANKETMAGL AKRKLEDRQA RIPESPSIRR AINAVKRYTS PTGHFRFDAD RTEAGHADEF 
WAFALCLSAA EGGSSPALAS IDTDTSLNRA RNGVDEDLVA AGARRERGDY MMGARNRDRR 
VW