Gene Acid345_4123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4123
Symbol
ID	4072314
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4885042
End bp	4886097
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	58%
IMG OID	637986154
Product	hypothetical protein
Protein accession	YP_593197
Protein GI	94971149
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.962461
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATGC TCCGCCATGT CGCGATGGTG ATGCTGCTCG CTGGCGTAAC TTTTGCCGGG 
GTGTGGCTGG CGCAGATCGA AGGCACTTGT CTGGACGAAG CCGGCAACCC CCTCGCCAAC 
GCCGAACTGA AATTTCTCGA CAAGCACAAC GGCCATCGCT TTTCCGTGAA GACCGACGCG 
AAGGGGAAGT TCTTCTTCGG CGGCGTGGAT CCGGGTGCGT ACTCGGTGAC AGTATTGCGC 
GGCAACCAGG TGGCGATGGA ATTTCCGGCG ATCGCGATTA GCTGGAGTTC GCGGCCGCAG 
CAGTTGGCGC TGGACCTGGC AAAACATTCC ATCGAGGTGA AGCGCGAAAC ACGCCAGGCG 
GAGACGCTCG GTGGAGACAC TTCTCCAGAC GACTTTACGC CGGTGGTAGT GGGAGATGAC 
GCGCAGACCG TAGCGGTACG AACGGCAATC GAGCAGGCGC AAAAGCAAGG ACAGAATGGA 
GACTGGGCCG GAGCGATTGC GACGCTGAAG GCGAACGCTG AGTCATCGGG CGCGAAGTAC 
GACATGGTGT GGGCGCAGTT GGCGAGTGCG TATTGCCACG CTAGCAAGTT TGAAGATTGC 
GCTGCGGCGT ACGGGAAGGC GCTTGCGCTC AAAGAAGTGG GTGCGTATTA CAACAATCGC 
GCGCAGGCGC TGGTCGTACT GAAACGATGG AATGAAGTTG ATCACGACAT GATGCTGGCG 
GAGAAGATGA ACCCGGAGCA TCGCGTGCTC TATGAGCGGA ACCACGGCAT GATGCTGGTG 
CAGAAAATCC AGAACGGCGA GAGCGACAAT ACGGCTACGG ATTTCGAGGG CGCAGTTCGT 
GCCTTAAGCT CTGTGCTGCA AGAAGAGCCG GCGAATGCTG AGCTTTATTA CTTACGTGCA 
TATTGCCAGA TCCGATTGCT CGGTGTGGCG AAGGAACCGC CTGCGTTTTC GGCAATTGAG 
AGTGGACTGC GCAAGTATCT TGAGTTGGAG CCGCACGGGA AGCATGCCGA AGAAGTGAAT 
GCGATGCTGA AGAGTGTGGA AGAAGAGAAG CGGTGA

Protein sequence

MKMLRHVAMV MLLAGVTFAG VWLAQIEGTC LDEAGNPLAN AELKFLDKHN GHRFSVKTDA 
KGKFFFGGVD PGAYSVTVLR GNQVAMEFPA IAISWSSRPQ QLALDLAKHS IEVKRETRQA 
ETLGGDTSPD DFTPVVVGDD AQTVAVRTAI EQAQKQGQNG DWAGAIATLK ANAESSGAKY 
DMVWAQLASA YCHASKFEDC AAAYGKALAL KEVGAYYNNR AQALVVLKRW NEVDHDMMLA 
EKMNPEHRVL YERNHGMMLV QKIQNGESDN TATDFEGAVR ALSSVLQEEP ANAELYYLRA 
YCQIRLLGVA KEPPAFSAIE SGLRKYLELE PHGKHAEEVN AMLKSVEEEK R