Gene Acid345_0291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0291
Symbol
ID	4070512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	306628
End bp	308268
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	60%
IMG OID	637982292
Product	cytochrome c, class I
Protein accession	YP_589370
Protein GI	94967322
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.85938
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGGTTT CGCGAACCCG CTCTATTTCT GTTATCGGAA TTTCATTGTT GCTCGCTGTA 
TTCGCCATCG CCCAGAACAA AGCATTTCAT AACGCCCCTG CCTCCGCGGC GGCAACGAAG 
AACCCCGTCG CTGGAGACGC TGCGGCGATC AAAGCCGGTA AGAACATCTA TTCGCAGAAC 
TGCGCTGCCT GCCACGGGCC CGATGGCGCG GGCACCGGAA ATGTTCCGTC GCTGAAGACT 
GGCAAGGCGC AGGAAGCGAA GGACGGAGAA CTGTTCTGGT TCATCACCAA CGGCGATGAG 
AACAACGGCA TGCCGTCGTG GAAAGGCCTG CCGCAAAGAC AGCGCTGGCA GGTGGTGAGG 
TACATCCGGG CGATGAAGAC TGCCGGGGCT GCGGCGCCAG CAAGTGCGGC GGCTTCCACT 
ACGACGGCGA GTCTGCCGAA GGCTTCCGGC AACGGGCCCT TTATTGACTA CCGCGATGAG 
AAGCCGGGGA CGGTCCGCAA GATTACAGCG AAAGATTTGC CGCCGCCCTA TGCGACGAAG 
TCGGCGGGCA ATGGTCCGCA CGTAGTGCCG CGTCCGCAGA ATGCGTGGCC GCAGGTACTG 
CCGGATTTCA AGATCGATGT GTTCGCAAGC AACCTGAACA ATCCGCGCGA GATTGTTACC 
GCGCCGAATG GCGATATCTT CGTCGCCGAG ACCGAACCCG GGAACATCAA GATCTTCCGC 
GGCATGACTG CCGACGGAAA GCCGCAGCAG ACTTCAGTCT TCTTAAGCGG ATTGAAGGAG 
CCGTTCGGAA TCGCGTTCTA TCCGCCGGGG CCGAATCCAG AGTGGATCTA TATCGGCAAC 
ACCAACGCCG TGGTGCGCTA TCACTACACG AACGGCGACC TGAAGGCGCG GGGCGAAGCA 
CAGAAGCTGG TGGACCTGCC GACCGGAGGT CACTCGACGC GCAACGTTCG CTTCAGTAAC 
GACGGCAAGA CGATGTTCAT CGCCGTGGGC TCGGAATCGA ATGTGGACGA TCCCGAAGAG 
AACACCGGCG AGAAGAACCG CGCGAACATC CTCGCGGCGA ATCCCGATGG CAGCAACGTG 
CACGTGTTCG CGGCAGGCAT TCGCAATCCT GTCGGACTTG CGGTGAATGC CCAGACCGGC 
GAGCTGTGGA CTTCGATCAA CGAGCGCGAT GCTCTCGGCG ACAACCTCGT GCCCGACTAC 
ATCACGCACG TGCAGGAAGG CGGTTTCTAC GGCTGGCCGT ACTACTACAT CGGCGGAAAC 
CAGGACCCGC GGCACAAGGG CAAGCATCCG GAGCTGAAGA ATAAGGTCAT TGTGCCGGAT 
GTGCTGATCC AGCCGCACAG CGCGTCGCTG GGAATGACGT TTTACAACGG CAAACAATTT 
CCGGCGGAGT ACCAGGGCGA CATCTTCGCC TGCGAGCACG GCTCGTGGAA CAAGGCGGTG 
CGCGTGGGCT ACGAAGTAGT TCGCGTGCCG CTACACCAGA CGAATCATGC GACCGGCGAG 
TATGAGGATT TTGTGACCGG ATTCGTAACA CCGGATGGAA ACGTATGGGG GCGTCCGGTG 
GGCGTGACCG TCGCGCCGGA TGGATCGTTG TTGATCACGG ACGACGGATC GAACGCAATC 
TGGCGCGTGA GCCACAAATG A

Protein sequence

MQVSRTRSIS VIGISLLLAV FAIAQNKAFH NAPASAAATK NPVAGDAAAI KAGKNIYSQN 
CAACHGPDGA GTGNVPSLKT GKAQEAKDGE LFWFITNGDE NNGMPSWKGL PQRQRWQVVR 
YIRAMKTAGA AAPASAAAST TTASLPKASG NGPFIDYRDE KPGTVRKITA KDLPPPYATK 
SAGNGPHVVP RPQNAWPQVL PDFKIDVFAS NLNNPREIVT APNGDIFVAE TEPGNIKIFR 
GMTADGKPQQ TSVFLSGLKE PFGIAFYPPG PNPEWIYIGN TNAVVRYHYT NGDLKARGEA 
QKLVDLPTGG HSTRNVRFSN DGKTMFIAVG SESNVDDPEE NTGEKNRANI LAANPDGSNV 
HVFAAGIRNP VGLAVNAQTG ELWTSINERD ALGDNLVPDY ITHVQEGGFY GWPYYYIGGN 
QDPRHKGKHP ELKNKVIVPD VLIQPHSASL GMTFYNGKQF PAEYQGDIFA CEHGSWNKAV 
RVGYEVVRVP LHQTNHATGE YEDFVTGFVT PDGNVWGRPV GVTVAPDGSL LITDDGSNAI 
WRVSHK