Gene Acid345_2031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2031
Symbol
ID	4073200
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2432517
End bp	2433905
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	61%
IMG OID	637984045
Product	hypothetical protein
Protein accession	YP_591106
Protein GI	94969058
COG category	[S] Function unknown
COG ID	[COG1641] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00299] conserved hypothetical protein TIGR00299

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCG CTTACATTGA ATGTTTTTCC GGGATCAGCG GGGATATGTT CCTCGGAGCC 
CTGGTGGATG CCGGGGTCTC CGCGGAATTG CTGCGACAGA CCGTGCGCGG GCTGAATCTT 
GGGGCGGAGC TGCAAGTTGC GCGGGTAGAC CGCTGCGGAA TCACATCGAC GAAGGTTGAT 
GTAGTGGTGA ATGGCGAGCC TGACCGTCCG CGGGAAAACG AGCAACCGGT GCACCATGTG 
CACTCGCATC AGCACGGACA CGAGCACCAG CACGAACATC ATCATGCCGA TGGGACCGTA 
CATGCGCATT CCCACGCACA TGACGATGAG CCCGGGCACA CCCACGAGCA CCCGCACGAG 
CATGAGCACG AAGATAAGGA AGATAAGCAT GACCACGCGC ATGGGCGGCA TCTGAGCGAG 
ATCAAGACGA TCATTGCCGG GAGCGCGATC AGCGAGCGCG CGAAGAAGAC GGCGACGGAT 
GTTTTCGAGG CGCTGGGCGC GGCGGAAGCG AAGATCCACA ACGTACCGGT AGAGACGATC 
CACTTCCACG AGGTGGGCGC GGTAGATGCG ATCGTGGATA TCGTGTGCGC GGCCGTGGGC 
GCCGAGGCGC TGGATGTCGA GCGCTTCGTG GTATCGCCAC TAAATGTGGG CGGCGGCACG 
GTGAAATGCG CGCATGGCGT GTTCCCTGTA CCGGCACCTG CAACCGTTGA GTTGCTCAAG 
GGCGCGCCGG TGTACGCGGG CGAAATCCAG AAAGAACTGG TTACGCCGAC GGGCGCGGCA 
CTGGTCAAAG TGCTGGCGCA CAGCTTCGGG CAGATGCCGG CGATGACCAT CGCCAAGAGC 
GGGTATGGCG CGGGGTCGCG CAACTTCCCT TCCCACGCAA ATGTGCTGCG CATCACTGTG 
GGCGAGGCAG CGGCCGTGGA AGAATCGAAG GGTGATCTTC CGCTGGATGA AGTGATTGTG 
CTCGAAGCGA ACATCGACGA CTTGAATCCG CAGCTTTTTG GCTACGTTGC CGAGCAGGCG 
CTGGCCGCCG GCGCGCTCGA TGTTTTCGCC ACGCCGGTGC AGATGAAGAA GAGCCGCCCG 
GGAACGCTGC TGACGTTGCT GGCAAAGCCT GAGGATGCGG AGCGAATTGC CCGGCTAGTG 
TTCCGCGAGA CTTCGACGAT TGGGATACGC ACCCGCCGCG AGCAGCGCTA CGTGCTGCCG 
CGCCGTCATG AAACGGTGCG CACGCAATGG GGCGAAGTGC GAATGAAGAT CGCGCAGATC 
ACGGGGAGCA TCAGTAACTA TGCACCCGAA TATGAAGATT GCCGGCGAAT CGCCGAACAG 
CATCATGTGC CGCTGAAGCA CGTGATGCAG GAAGCTATCA GGCTTTACCT GGAACACACG 
AATGTCTAA

Protein sequence

MRIAYIECFS GISGDMFLGA LVDAGVSAEL LRQTVRGLNL GAELQVARVD RCGITSTKVD 
VVVNGEPDRP RENEQPVHHV HSHQHGHEHQ HEHHHADGTV HAHSHAHDDE PGHTHEHPHE 
HEHEDKEDKH DHAHGRHLSE IKTIIAGSAI SERAKKTATD VFEALGAAEA KIHNVPVETI 
HFHEVGAVDA IVDIVCAAVG AEALDVERFV VSPLNVGGGT VKCAHGVFPV PAPATVELLK 
GAPVYAGEIQ KELVTPTGAA LVKVLAHSFG QMPAMTIAKS GYGAGSRNFP SHANVLRITV 
GEAAAVEESK GDLPLDEVIV LEANIDDLNP QLFGYVAEQA LAAGALDVFA TPVQMKKSRP 
GTLLTLLAKP EDAERIARLV FRETSTIGIR TRREQRYVLP RRHETVRTQW GEVRMKIAQI 
TGSISNYAPE YEDCRRIAEQ HHVPLKHVMQ EAIRLYLEHT NV