Gene Acid345_0200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0200
Symbol
ID	4069669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	213300
End bp	214415
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	61%
IMG OID	637982200
Product	hypothetical protein
Protein accession	YP_589279
Protein GI	94967231
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.337224
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGTG TTCGCCTCCT CGTTGGCACC AAGAAAGGTG CCTTCGTCCT TACCTCTGAC 
GGCAAGCGCG AAAAGTGGGA CGTCGCCGGC CCCCATTTCT CCGGGTGGGA GATGTACCAC 
CTCAAAGGAT CTCCTGCCGA CCCGAATCGC ATCTACGCAT CGCAGACCAG CGGCTGGTTC 
GGCCAGCAGG TCCAGCGCTC CGACGATGGC GGCAAAACCT GGAACCCCGT CGGCAACAAG 
TTCATTTATG ACGGCGTCCC CGGCACCCAC CAGTGGTACG ACGGCACGCC CCACCCGTGG 
GATTTCAAGC GCGTGTGGCA CTTCGAACCG TCCCTCACCG ATCCCGACAC CGTCTATGCG 
GGCGTCGAAG ATGCCGCCAT CTTCAAGACC AACGATGCCG GCCAGACGTG GACCGAACTT 
CCCGGCCTTC GCAACCACTC CACCGGCAAC AAGTGGACGC CCGGCGCCGG CGGCATGGGC 
CTGCACACCA TCATCCTCGA TCCCACCAAC GACAAGCGCA TCTGGATCGC CATCTCCGCT 
GCCGGAGCTT TTCGCACCGA TGACGGCGGT GCCACCTGGA AGCCGATCAA CAAGGGCCTC 
ACTTCGAAAT ACATCCCCGA CCCGGACGCC GAGATCGGGC ACTGCATCCA CCACATGGCC 
ATGCATCCGA AGAAGCCCGG CACGCTCTTC ATGCAGAAGC ACTGGGACGT CCTCCGCAGC 
GACAATTCCG GCGACCTCTG GACCCGCGTC AGCGGCAACC TGCCCACCGA TTTCGGCTTC 
GTCATCGACG TCAACGCGAA CGAACCTGAG ACCATCTATG TCGTGCCCAT CAAGAGCGAC 
GAACACCATT ACCCCATGGA TGGCGCCCTC AAGGTCTATC GCAGCAAGTC TGGCGGCAAC 
GAATGGGAGC CGCTCACTAA GGGTCTCCCG CAGCAGAACT GCTACGTAAA CGTGCTGCGC 
GACGCCATGT CCGTAGACCA ACTCGATAAG TGCGGCATTT ATTTCGGCAC CACCGGCGGC 
CAGGTCTACG CGTCCAATAA TGCAGGAGAC AGTTGGCAGG CGATCGTTCA CGATCTCCCG 
GCCGTCTATT CCGTAGAGGC GCAAACGCTA CCATGA

Protein sequence

MSSVRLLVGT KKGAFVLTSD GKREKWDVAG PHFSGWEMYH LKGSPADPNR IYASQTSGWF 
GQQVQRSDDG GKTWNPVGNK FIYDGVPGTH QWYDGTPHPW DFKRVWHFEP SLTDPDTVYA 
GVEDAAIFKT NDAGQTWTEL PGLRNHSTGN KWTPGAGGMG LHTIILDPTN DKRIWIAISA 
AGAFRTDDGG ATWKPINKGL TSKYIPDPDA EIGHCIHHMA MHPKKPGTLF MQKHWDVLRS 
DNSGDLWTRV SGNLPTDFGF VIDVNANEPE TIYVVPIKSD EHHYPMDGAL KVYRSKSGGN 
EWEPLTKGLP QQNCYVNVLR DAMSVDQLDK CGIYFGTTGG QVYASNNAGD SWQAIVHDLP 
AVYSVEAQTL P