Gene Acid345_0416 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0416
Symbol
ID	4068735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	478185
End bp	480206
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	60%
IMG OID	637982420
Product	hypothetical protein
Protein accession	YP_589495
Protein GI	94967447
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0810829
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGCGC AATCCTGTTG CATCGCTCAT GCTCTCGACA TACAATCACC GCCTTCCCAC 
CGGCTCCAAG TCCCGACTTT AGTTTCAATT TCCCGTTGCG AGGAGACTGC GATGCGCAAG 
TTGGCAGGAA TCACTGTCGT GCTGACCGTT GTATTTGCCG CGTGGAGCGC GCTGGCCGCC 
ACACCAGCGA CGATGGTCAC CCCGGTTGCC GGCTCGAAGT TCGCAGGGGC GAACGTGACC 
TTCACCTGGA ATGCGGGCGC AGGAGTCTCG CAGTACTCGC TTTACATAGG GACAACGCCG 
GGGGCGCACG ATCTGGCTTT CGTGAGCACC GGAGTGTCGA CGACGACGAC CGTGAACGGT 
CTGCCCACGG ACGGGCGCAA CATTTATGTC ACGTTGTATT CGCTGATTGC CGGGGTATGG 
CAGGGGAATC GCTACAGCTA CTTCGCCTCG GGTGCCGGTG TCGCCGCAAC AATGACCGCT 
CCGGCTGCCG GTTCGAAGTT GGCGGGCGCG AGCGTGACGT TTTCATGGAA TACGGGGGCG 
GGTATTTCGC AATATAGCCT CTACGTCGGG AATACGAAGG GAGCACACGA CATCGCGTTC 
TCAAGCGGCA ATGTGACGTC GAAACTGGTC AACGGCCTTC CGACGGACGG ACGGATGGTT 
TACGTCACGC TGTACTCCCT GAACGGCTCG ACCTGGCTGA GGAACTACTA CACATATGTC 
GCGTCGGGAG TCGGCGTGGG GGCGGTAATG TCGTCGCCAG CGCCTGGATC TACCTTCGCA 
AACTCTGCAG CGAACTTTTC GTGGACGAAC GGGACCGGCG TCTCTGAGTA TTCGCTTTAC 
GTGGGGAGTA CACCGGGGGC GCATGACATT GCCTATGTGA ATGCCGGAAG CATCCCGTTA 
GCCACGGTTA CGAACCTGCC GACCAATGGG TCAACCGTGT ATATCAACCT CTATTCGCTG 
AATGGGGCGA CTTGGCTGAG GAACAGTTAT ACATACACGG CTGCGGCCGC GCCCTCAAAG 
CGGGTAGCCT GGATTCCCGA CTTCTACGGC GAGACATTGC AGGTGCGGAT CGGCACTGGC 
GCCGGTGCGA TCGCCACCAG CGTCAACCTG CCCACATGCA ATCCGAACAG CGTCGCGGTA 
AACAGCGATA AGGCATACGT CGTGTGCTCG GCCTTCGAGG CGAATCCTGA CAAGATCCTG 
GTGTACGACG CGACCGTGAT TCGTGCCTCG GCGGGGGGCG TATTGGCGAT TAGTCCGACG 
AAGACGATCA CGAGCGCGCA GTTCAACTCG CTGATCGGAA TCGCCTTTGA CGCTGGGAAC 
AACCTCTGGG TGGCGAGTTA CGGAAACCAT CAGATCAACG AGATCACCGC TGCGGAACTG 
GCGAAAGCCT CGCCTACCGC TACGGCGGAG TTGGTTCACT CTCCTGACAA TCCGGTAACG 
CTCACCTTCG ACAGTTCCGG AGGCATGTGG GTGAGCGGGC AGTACTCGGG CGGAATCGTG 
CTGCACTTCC CGAGCAGCCA GATCCACAGC GGCTCCGGCG CAACTCCTGA CTATTGCCTG 
GCGACGACGG ACCTCGGGGC GGGATGCCAG TTCGTGGACG GCATCTTCTT AAACCCGGAG 
GGGCTCGCTC TCTATAACGG GGACGTCTGG GTGGCGAACA ACGCTACGGG AGCAGCCGGT 
GAGGTCCCGG GACGACAACT CGTGGACTTG AAATTCAATG CCGGGAACGT GACGGTGAAC 
GGTACGTTCG GTGATCCAAC TGCCGCTGCG AAGAGCCCGT TCGTCTGTCC GGGCGGACTG 
TTCGCGGGAG CAATCCATCT TTGGATCAAC GACGAGAGCT ATGCCGAGGC GGATCCGCAG 
TGTGGCGCCA TGGGCGACGT ATCGGCTGCA ACTGGCGGTG TGTTTGCGTT CACGCCGGCA 
CAACTGGCCG CCCGGAGCAC GTCCACGAGC CAAGTGCTGC CGTATTCCGG GGTTACCGGA 
AGACCAGGAT TCGGGGGCAT TTTTGTCGAG AAAGACCAGT AG

Protein sequence

MRAQSCCIAH ALDIQSPPSH RLQVPTLVSI SRCEETAMRK LAGITVVLTV VFAAWSALAA 
TPATMVTPVA GSKFAGANVT FTWNAGAGVS QYSLYIGTTP GAHDLAFVST GVSTTTTVNG 
LPTDGRNIYV TLYSLIAGVW QGNRYSYFAS GAGVAATMTA PAAGSKLAGA SVTFSWNTGA 
GISQYSLYVG NTKGAHDIAF SSGNVTSKLV NGLPTDGRMV YVTLYSLNGS TWLRNYYTYV 
ASGVGVGAVM SSPAPGSTFA NSAANFSWTN GTGVSEYSLY VGSTPGAHDI AYVNAGSIPL 
ATVTNLPTNG STVYINLYSL NGATWLRNSY TYTAAAAPSK RVAWIPDFYG ETLQVRIGTG 
AGAIATSVNL PTCNPNSVAV NSDKAYVVCS AFEANPDKIL VYDATVIRAS AGGVLAISPT 
KTITSAQFNS LIGIAFDAGN NLWVASYGNH QINEITAAEL AKASPTATAE LVHSPDNPVT 
LTFDSSGGMW VSGQYSGGIV LHFPSSQIHS GSGATPDYCL ATTDLGAGCQ FVDGIFLNPE 
GLALYNGDVW VANNATGAAG EVPGRQLVDL KFNAGNVTVN GTFGDPTAAA KSPFVCPGGL 
FAGAIHLWIN DESYAEADPQ CGAMGDVSAA TGGVFAFTPA QLAARSTSTS QVLPYSGVTG 
RPGFGGIFVE KDQ