Gene Acid345_3601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3601
Symbol
ID	4072823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4260739
End bp	4261890
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	60%
IMG OID	637985624
Product	hypothetical protein
Protein accession	YP_592676
Protein GI	94970628
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.897301
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0489209
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGTGGG GTCAGCGATA CGTGTACCTG GCGGTTGCCA CCCTCCTGTT CTCCCCCGTT 
TTTCTGCGCG CCCAACTCAC GACCGACGAC CACGTGCTGG GTTTCGAGTT CTGGCCCACC 
AAAGAGATTG CTTCGCAAAA AGACATTGTC GGCAGCCAGG TTTGTGCCAG TTGTCATGCC 
GACAAAGCCA ACACGCAGAA GATCACGCCG ATGGGAGAAA CTTCCGTCCA CGCCGTGGAC 
GCCTCCCCCC TCCGCGATCA TCCCGCACTG ACGTTTAAGG GTGGCGCCGC CACGTACGAG 
ATCCACACCG ACGGGACCCA CGCAACCTTT AGCGCCACCG TCAATGGGCA GTCCAAGTCC 
GCAGACCTGC TATGGGCCTT CGGCAACGGT CACCTGGGAC AGTCTTATCT TTTCAAGAAA 
GAGGACGGCT ATTACTACGA AGCGCGAGCG TCGTACTTCG AGGTACTGAA ATCGCTGAGT 
TGGACGCCGT CCCGCGAACT GACGCGGCCC GAGTCGGCAG ACGAGGCAAT GGGACGCCGC 
ATTCCCGATA CCGAGTTGAA GAAGTGTTTC GGTTGCCATA CCACGGGATC GAACGTCGCC 
GGACGTCTCA CCGAGACCAA CGTGAAGTCT GGCGTGAGTT GCGAAGCCTG CCACGGACCT 
GGGGCCTCGC ATGCGGCGGA AGCTGCGGTG GCCATGTCGG CAGGAACGCC GGATGCCGCG 
CGCGGCGGCA TTCTCAATCC CGGCAAGCTT TCACCCAGTG ATTCCGTGGA TTTCTGCGGT 
GCCTGCCACA TTTCCTATTG GGACCTGACG CTGCAGCGCG GGCGCGGAAT CGCCACATTA 
AAGGCGCAGC CCTTCCGCCT GGAGCAGAGT AAGTGCTGGC AAAAGGGCGA TGCTCGCCTG 
ACCTGTACGG CCTGCCACGA TCCCCACAAG CCGCTGGTCA CGGAAGCCAA ATCTTACGAC 
CACAACTGCC TGCAGTGTCA CGTGCTGATG GGCCAGAAAC CCACGGCCGA GCAAATCGGT 
AAAGCCTGTC CCAAGTCCAC CAGCGACTGC GCTACCTGCC ACATGCAGAA GATCGAATTG 
CCCGACTTCC ATCATACTTT CACCGATCAC CGGATTCGGA TCGCCAAAGC CGGAGAGCCG 
TTCCCGGATT AA

Protein sequence

MKWGQRYVYL AVATLLFSPV FLRAQLTTDD HVLGFEFWPT KEIASQKDIV GSQVCASCHA 
DKANTQKITP MGETSVHAVD ASPLRDHPAL TFKGGAATYE IHTDGTHATF SATVNGQSKS 
ADLLWAFGNG HLGQSYLFKK EDGYYYEARA SYFEVLKSLS WTPSRELTRP ESADEAMGRR 
IPDTELKKCF GCHTTGSNVA GRLTETNVKS GVSCEACHGP GASHAAEAAV AMSAGTPDAA 
RGGILNPGKL SPSDSVDFCG ACHISYWDLT LQRGRGIATL KAQPFRLEQS KCWQKGDARL 
TCTACHDPHK PLVTEAKSYD HNCLQCHVLM GQKPTAEQIG KACPKSTSDC ATCHMQKIEL 
PDFHHTFTDH RIRIAKAGEP FPD