Gene Acid345_3646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3646
Symbol
ID	4072249
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4313889
End bp	4315649
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	60%
IMG OID	637985669
Product	hypothetical protein
Protein accession	YP_592721
Protein GI	94970673
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAGAC TTGTTTCGGC ACTCTTCCCT GCAGTTTTCC TCGCGGTCCT TTCCGGTTGT 
GGCGGTTCAT CGAGTTCGCC GACACCCACG CCGAAGCAGT CGATTCAATA CGCGGTGAGC 
CCTTCTTCCA TTGACTTGCA GCAGGATGGG ACGAAGAGCA CCGTTTCGGT CACGGCAACC 
TGCCAGAACC TCGATACGGT TTCGGCCGAC ATCACAGGGC TGCCCACGGG CGTAACCGCG 
AGCGTAACGC AACCGACGTG TTCCACGGCC GGGAGCATTG ACTTCACCGT TACGGATGTT 
GCGAACGCGC GCGCAACGTC CTATACGGTA GTTGTTGGTA CTCCGAACGC CGCGAATGTC 
ACGACCGCGA AGCTGGCCAT GAACGTCGTT GCGCAGGCCG CGGTGACGCG GACGGCGACA 
GGCTTGAAGA CCGCGTTCAT GTCCACCTCG TTCCAACTCG CGGACTGGTC GTACTCGTGG 
CTGAACGATC ATCCGGCGAC GATTCCGCCG CTCAACAATC TTGCAGAGCA GCACATCCGC 
ATTCAACTGA TCGACGGCGC AGTACCGCAG ATCGACGCCG CGAATTGGGA TTTCACCAAG 
GCGGATGCGA CCATCCAGCC GCTGCTTGCG GTGGGCGACG ATAGTCCTGA GCTGCAGATC 
GGCACGGTGC CGGCCTTCCT GGGTGACAGC AGTGGCCACT ACGTGGAAGC GAACCTGCCG 
GCATTTGCCG AGTACTGCGC GAACCTGGTG CGCTACTACA ACAAGGGCGG CTTCAGCGTG 
GGCGGCAAGC TCTACAAGTC CTTGAGCAGC ACGCCGATCA AGTGGTGGGG GATTTTTAAC 
GAGCCGAACT GGAACAGCGT GACTCCCGCG CAGTACCCCA CGATGTACAA CGCAGTCGCG 
GCGTCGATGC TCGCGGTGGA TCCCGACATC AAGTTAGTCG GGCTGGAACT GGGCGATGTG 
ACGGGCATGG CGCAGAGCTA CATGCCGCCG TTGTTGAGCG GCGTGACACA GCCGATGCAT 
GCACTGGCCA GCCATTACTA CAGCACGTGC AACCAGAAAG ATTCCGACGT GCAGTTGTTC 
TCACAGGTGC AGATGTTCCA CGACCAGACC GCTTACATCC GGACTACGCT GGATGCAAAT 
GCGCCGACGG CCGGTCTGCC GATCTGGATA ACCGAGAACA ACGTGAATGC CGACTACGAC 
AAAGGCGGCG GTATTAGCGC CTGTAATGGC GGTGCGTTCA CCGAAGATGA CCGCGGCACA 
AGCGCATACT TCGCGGCGTG GCGTCCGTTC GTCTATTCCC AGATGGTGCA CGCCGGAGCG 
GCGGGCATTT GGCATTGGTC GTTTTACGGC GGTGGGCAAT ACGGCGAGTA TGCCGACGAC 
AGCACGCCGT ATCTCAGCTA CTGGGTGGAC TACGAACTTT CGCACCTGCT CGGACAAGAG 
AGCATGACGG AGGTCAGCAG CAGCGTGACG GAGCCGAGTC GCATCGAGAT GTTCGCGGCG 
AAGGCCGCGG ACGGATCCCG CGTGATCATG GTGGTGAACC ACGACGTGGC TGCCGATTCC 
GACAACAACG GGCAGGGCGT GCCGAAAAAA GTGCAACTCG ATCTCAGTGG CGCCGGTTCG 
TTTACAACGG CCACATTGAT CGCCGTCGAT AAGAGCACCA GCATAGCCAC TGGGCCTACG 
ACGACGACGC TCACGCCAAC CGCCGGCGTC GTCACGCTGA CTTTCCCCGG CTACGGCGTG 
CAGTTCGTAC AGCTCAAATA G

Protein sequence

MRRLVSALFP AVFLAVLSGC GGSSSSPTPT PKQSIQYAVS PSSIDLQQDG TKSTVSVTAT 
CQNLDTVSAD ITGLPTGVTA SVTQPTCSTA GSIDFTVTDV ANARATSYTV VVGTPNAANV 
TTAKLAMNVV AQAAVTRTAT GLKTAFMSTS FQLADWSYSW LNDHPATIPP LNNLAEQHIR 
IQLIDGAVPQ IDAANWDFTK ADATIQPLLA VGDDSPELQI GTVPAFLGDS SGHYVEANLP 
AFAEYCANLV RYYNKGGFSV GGKLYKSLSS TPIKWWGIFN EPNWNSVTPA QYPTMYNAVA 
ASMLAVDPDI KLVGLELGDV TGMAQSYMPP LLSGVTQPMH ALASHYYSTC NQKDSDVQLF 
SQVQMFHDQT AYIRTTLDAN APTAGLPIWI TENNVNADYD KGGGISACNG GAFTEDDRGT 
SAYFAAWRPF VYSQMVHAGA AGIWHWSFYG GGQYGEYADD STPYLSYWVD YELSHLLGQE 
SMTEVSSSVT EPSRIEMFAA KAADGSRVIM VVNHDVAADS DNNGQGVPKK VQLDLSGAGS 
FTTATLIAVD KSTSIATGPT TTTLTPTAGV VTLTFPGYGV QFVQLK