Gene Acid345_2141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2141
Symbol
ID	4072383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2559887
End bp	2560927
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	61%
IMG OID	637984156
Product	hypothetical protein
Protein accession	YP_591216
Protein GI	94969168
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3386] Gluconolactonase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAACC CCGGCCTCAT TCATCGAAAC GGCGCGCCCC ACATCGATTC CGTCGAACCG 
GCATTTGCCA TGCCCGGCGG AGAGGTCAAG CTTGTTGGTC ACGCGCTCGC GCCCCACGAT 
CTTCGCCGCC CGCACGTGCA ATTCGGCGAC ACCGCAGCGC CAGTCATCAT TGGCTCCGAA 
AACTTTGTAC TCGCCCGGGT TCCCAACGAT GTGCCCTCAA GCAACGTCTC CGTCCACGTA 
AATGGGCGCG CGAGCAACGA GCGCATGGTC CGCGTGGCCA TGCCGATCGC CGAGAACCTG 
CACCCCGTCA CCAGCCCGGC TGTCGATCGC GAAGGCGATC TTTACGTCAC GTTCTCCGGA 
TCGCGCGGAC AAAAAGTCCC GGTAGCGATC TACAAGGTTG ATACCAACTA CACCGTCCGA 
CCGTTCCTCA ACGAAATGAT GAACCCGACC GGCATGGCCT TCGACCGCAC CGGACATCTC 
TTTGTCTCGT CGCGATTCGA CGGCGCCGTC TATCGCGTTG CGGCGAATGG CACCATGACC 
ACCTACGCCG AGGGGATGGG CGTCGCGACC GGGATCGCCT TCGACACCGA AGAAAACCTC 
TTCGTCGGGG ACCGTAGCGG AACGGTGTTC AAGATTGGCC GCGACCGTCA GATTTACGTC 
TTTGCCACCT TGGAACCGAG TGTTTCCGCT TATCACCTTG CATTCGGGCC AGCCGGAAAT 
CTCTACGTTA CCGGCCCAAC CACATCCAGT TTCGACGCCG TTTACGAGAT CTCTCCGGAG 
GGAGAGGTCA CGCTCTACTA CCGCGGCCTA GGACGCCCGC AAGGCCTCGC CTTCGATATT 
GACGGCAACC TGTACGTCGC CGCGTCACTC AATGGCAAAC GCGGCATCGT GCGAATCACG 
CCGCAGCGTC GCGCCGAACT GGTCGTTTCC GGCAACAATC TCGTCGGCCT CTGCTTCACT 
CCAGGCCGCG CTGTAGTACT CGCGACTACC GACGCCGTCC ATCATCTCTG GTGGGATATC 
CAGGGTCGGC CGCTTCTCTA A

Protein sequence

MSNPGLIHRN GAPHIDSVEP AFAMPGGEVK LVGHALAPHD LRRPHVQFGD TAAPVIIGSE 
NFVLARVPND VPSSNVSVHV NGRASNERMV RVAMPIAENL HPVTSPAVDR EGDLYVTFSG 
SRGQKVPVAI YKVDTNYTVR PFLNEMMNPT GMAFDRTGHL FVSSRFDGAV YRVAANGTMT 
TYAEGMGVAT GIAFDTEENL FVGDRSGTVF KIGRDRQIYV FATLEPSVSA YHLAFGPAGN 
LYVTGPTTSS FDAVYEISPE GEVTLYYRGL GRPQGLAFDI DGNLYVAASL NGKRGIVRIT 
PQRRAELVVS GNNLVGLCFT PGRAVVLATT DAVHHLWWDI QGRPLL