Gene Acid345_2640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2640
Symbol
ID	4072049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3114217
End bp	3115626
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	60%
IMG OID	637984657
Product	hypothetical protein
Protein accession	YP_591715
Protein GI	94969667
COG category	[R] General function prediction only
COG ID	[COG0400] Predicted esterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.123616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACGCT TCCTCGCCGC TTTCCTGCTC ACGGCCGCGG TTTCCTTTGC GCAGAACTTT 
GCCAACAACC TGCCGCATGG AACTGTGATC GAGCGCGTGG AGTGCAAGGC TGATCCGTCC 
TCCAGTTACG CCGCGTACCT GCCCTCGAAC TTCACGCCCG AGAAAAAGTG GCCGATCGTG 
TTTGCCTTCG ATCCTGGAGG CCGTGGCGCC ATGCCAATCA AGCTCTACAA AGACACTGCC 
GAGAAATACG GCTTCATCTT TGTCGCCTCC AACGACTCGC GCAATTTCTC CGCCGCCGAC 
TCCGATCGCG GCACTCGCGC CATGTGGCTC GACACCCACG ACCGCTTCCC GATCGACGAG 
AACCGTGTGT ACACCACGGG CTTCTCCGGC GGCGCGCGCA TGGCCGGTCA CGTCGCCCTT 
GCCTGTACCG GATGCAAGAT CGCGGGCGTC ATTGCCCACG GTGCCGGATA TCCGGTCAGC 
ATCCGTCCGA CCGACAAGAA TGGCCCCGCC TACTTCCTTA TGGTGGGTGA TGTTGACTTC 
AACTGGCAGG AAGTTATCAA GATCCGCCAG CAGCGCGAGG ACCAGGGCTA CGCATATCGT 
GTCGAGACCT TCCACGGGCC GCACCAATGG GGTCCTCCTG AGCTGTTCGA GGCGGCCATG 
CGGTGGATGC AACTGAAAGC CATGCAGCAA AACCGCATGC CACGCGAGCA GGCATTCATT 
GACTTGTTCT ACAAAGGCGA AGAGCTTCGC GCTGTCGAAG CCCAACAGCA ACATGACACT 
CTGGCCCTAC TGGCCGCCTA CCGCTCGCTC GTCTCCGATT TCGAAGGCCT GAAAGACAAC 
GCCGATTACG CGAAGAAACT GGCTGCACTC AAGTCGTCAA AAGATTTGAA AGAAGCGCTC 
AAGAAAGAAA ATGAGCAAAT CACACAACAG GCCGAGGCCA CTACTGACGC CGATACCGCG 
CTCGCAAAAC TCGGAGCCGC CAGCTCTCCC TCCGACCGCA ACACCGCCAT CAGCGACGCC 
ACCGCCGCGA TGAAGACCCT CAAAGACCAA GTCGAGCGCA CGAAGTCCGG TACTAAGTCG 
CTCGTGCTGC AACGCGCGTT CGCCGAGGTC TTCGCCAACA CCATCGAGCG TGGGCAGGCG 
CAGTTAGAAA ACAAGAAGTA CGACAACGCG GAGATGTACT TTACGTTGAT CGCAACCGTC 
AGCGACGAGC CCTGGCCGCA ACTCCTGCTC GCCGACGCCC GCGCTGAGCA AGGGAATCGC 
AAAGGCTCGC TACAAGCGCT CGACAAGTGC ATTAAGTCCG GGTTGAAGAA TCCCAAGGCA 
CTCGAAACCG ACGCCCACCT CCAGTCGCTT CGAGCCGATC CAGAGTTCCA GCGCCTCGTT 
GCTTCGCTGC AGAATTCCGG CCAGAAGTAG

Protein sequence

MRRFLAAFLL TAAVSFAQNF ANNLPHGTVI ERVECKADPS SSYAAYLPSN FTPEKKWPIV 
FAFDPGGRGA MPIKLYKDTA EKYGFIFVAS NDSRNFSAAD SDRGTRAMWL DTHDRFPIDE 
NRVYTTGFSG GARMAGHVAL ACTGCKIAGV IAHGAGYPVS IRPTDKNGPA YFLMVGDVDF 
NWQEVIKIRQ QREDQGYAYR VETFHGPHQW GPPELFEAAM RWMQLKAMQQ NRMPREQAFI 
DLFYKGEELR AVEAQQQHDT LALLAAYRSL VSDFEGLKDN ADYAKKLAAL KSSKDLKEAL 
KKENEQITQQ AEATTDADTA LAKLGAASSP SDRNTAISDA TAAMKTLKDQ VERTKSGTKS 
LVLQRAFAEV FANTIERGQA QLENKKYDNA EMYFTLIATV SDEPWPQLLL ADARAEQGNR 
KGSLQALDKC IKSGLKNPKA LETDAHLQSL RADPEFQRLV ASLQNSGQK