Gene Acid345_4366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4366
Symbol
ID	4071784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	5174062
End bp	5175552
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	60%
IMG OID	637986399
Product	hypothetical protein
Protein accession	YP_593440
Protein GI	94971392
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.9507
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.531855
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCG ATGTGGTGGA GACTCCGACG AAGGCGGAGG CGGTGGATGA TCCGGATCTT 
CTCGATCTAG TGGAGGAGGG CCGGAAACTG GACCAGAGGT ATTCGAAGCG GTGGCTGAAT 
CGTGACGTGT GGACGACGAT GCTGTTGCAG ATCCGCGAGA AGCATGGGCA CCTGATTCCA 
CTTCGGTTGA ACCGGGCACA GCAACACTAT GCGAAGACGT GCTCGCGGCG AAACATTGTT 
TTGAAGGCGC GACAGCTGGG AATTACGACG TATGTCGCGT CGCGATTTTT CTTGAGTACG 
ATTATGCGGC CGGGGACGGT TACGGTCCAG GTGGCGCACG ACCAGACGGC GGCCGAGGAG 
ATCTTCCGCA TCGTGCATCG CTTCGTGGAG AACCTGCCCG AAGAGATGCG GAAGGGCGCT 
TTAACGACGT CGCGGCTGAA CACGCGGCAG ATTGTGTTTC CGAAACTGGA TAGCGCGTAC 
CTGGTGGAGA GCGCGGCGGA CGTGAATGCG GGGCGTGGGC TGACGATCCA TAACCTGCAT 
TGTTCGGAGG TGGCGCGCTG GCCGGGAGAT GCGGCGGAGG TGCTGGCGTC ACTGCGGGCG 
GCGGTGCCGA AGCATGGCGA GATTGTGCTG GAGAGCACGC CGAATGGCGC GGGTGGATGT 
TTTTACGATG AGTGGCAACA TGCGGAAGAG AAGGGATACA CGCAGCACTT CTTTCCGTGG 
TGGTGGGAGA AGAGCTACAC GATTGGGCAT CGCGCGGAGG AGCTGAGTCC GGAGGAGGAG 
TCGCTCGTGG GGCGATATGG ATTATCGCGA GAGCAGATTG CGTTTCGTCG CGAGCTGCAA 
TTTAACTTCG GCAAATTGGC GCGGCAGGAG TATGCGGAGA CGCCGGAAGA GTGTTTCCTG 
GCGAGCGGCG AATGCGTGTT CGAAGTGGAC GTCATCGAGA AACGTTTGGC CGAATTGCGC 
GGGCCGGTGG AGACGCGCGA GAACGGGCGG ATCGAGACTT ACTATCCGCC GGTGCGTGGA 
CGAGAGTATG TGATTGGCGT GGATCCGGCG GGCGGTGGAT CGGAAGGCGA CTATGCCGCA 
GCGCAAGTGA TTGAACGCTC GACGGGGTTG CAGTGCGCGG AATTGCGCGG GCATTACACG 
CCGGTGGAAC TGGCTTCGCG AGTTTCACAG TTGGGTCGCG AGTATAACGA CGCGTTGGTG 
GCGGTGGAGC GGAACAATCA TGGTTGCGCC GTGCTGGTGT GTTTGGAACA GAGTTATCGT 
CATCTTTATG AAGAGCGCGG GCAGACGGGG TGGTTGACTA CTTCGGCTTC GCGGCCTCGG 
ATGATTGAGC AGTTGGCTAG CGTTCTACGG CAGGAACCGG AGAAATTCGA ATCGCGGCGG 
TTGCTGGAGG AGTGTAAGGC GTTTGTGCGG AAGAGCGACG GAGCGTGCGC GGCTAGTAGC 
GGAGCGCATG ATGATTTGGT TTTGGCCATG AGCATTGCGG TGAGTGTTTA G

Protein sequence

MSSDVVETPT KAEAVDDPDL LDLVEEGRKL DQRYSKRWLN RDVWTTMLLQ IREKHGHLIP 
LRLNRAQQHY AKTCSRRNIV LKARQLGITT YVASRFFLST IMRPGTVTVQ VAHDQTAAEE 
IFRIVHRFVE NLPEEMRKGA LTTSRLNTRQ IVFPKLDSAY LVESAADVNA GRGLTIHNLH 
CSEVARWPGD AAEVLASLRA AVPKHGEIVL ESTPNGAGGC FYDEWQHAEE KGYTQHFFPW 
WWEKSYTIGH RAEELSPEEE SLVGRYGLSR EQIAFRRELQ FNFGKLARQE YAETPEECFL 
ASGECVFEVD VIEKRLAELR GPVETRENGR IETYYPPVRG REYVIGVDPA GGGSEGDYAA 
AQVIERSTGL QCAELRGHYT PVELASRVSQ LGREYNDALV AVERNNHGCA VLVCLEQSYR 
HLYEERGQTG WLTTSASRPR MIEQLASVLR QEPEKFESRR LLEECKAFVR KSDGACAASS 
GAHDDLVLAM SIAVSV