Gene Acid345_3547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3547
Symbol
ID	4069279
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4196927
End bp	4198750
Gene Length	1824 bp
Protein Length	607 aa
Translation table	11
GC content	58%
IMG OID	637985570
Product	hypothetical protein
Protein accession	YP_592622
Protein GI	94970574
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGTATC CCGCGTCTGT GTTTGGGCCT GCCGTACGTA ACCAAGTTCT CCGTTCCCTT 
TTATTGATTG CTCTCATTCC GGCTGCTCTT TTCTTGAGCG CCTGCGGCGG CAGTAGTTCC 
AGCACGACAG CAACTACCGG AGTCGCGCCA GTCTTCACCA GCACGGCTCC GACCATCGCG 
CGCGAAGGCG TTCTGTATAC CTACGACGTC ACCACGACGA CGTCGGACGG CAGCACGGTG 
ACCTACGCGG CAACCACTGT CCCGAGCGGC GCCACCTTCG ATGGCGCCAC CTTGAAGTGG 
ACGCCTACCC ACGCCGAATC GCGTATCTCG AACTCATTCA CAATCACTGC TACCACCAGC 
AATAACGGAA CCGCCACGCA GTTCTTCAGC GTCACGCCAA ATGGCAATAT TGACGGTACC 
GCCGTTGATC ACGCCGTCAC GGGCAGTGGC TTGAAAAATT ACAACCAGGA CCTCAGCGGT 
TCTGTCGTCG AAGCCCTCGT TCCCGATGGC AAGGGTGGCT ACAACACGGT GAGAGGATCG 
GGCAAGGATG ACGGCACCTT CAGTGTGGGC AACATCGGCA CCGGCAGCTT CTGGCTGCAT 
GTGCAGCAGC CGGAGGTCGG TACTCTCCAG GACAATTACA TCTGGACCAA CGCCAGTGAT 
GTCGACCTCG GCATGCTGCT CGGCCAACGA CCGGATGTTG TGCAGGAGAA GCTCGGCCAG 
ACCATCACGA CAAGCTTCGA TCTCGCCGTT GCCCCTAAGA GCGAAGACTC TCTCGCGTGG 
GCAAGTCCAG ATGCAGGTGC TTTTGGAAAC GGCCTGCCGA CTTCTTTCAC GCAACATCTT 
GTGTCAACGT TCCCGCAGTC GGGCGGCCTC ATCGATAGTG CCAAGGGAGA TCGCGGCTTC 
TTTGTTCATT ACTCGCCAAC GTCCACTGGC CTCGGCGTAG CCGTTGATGC TGCCGAATAC 
GACAGTATTA CGCAGACTGA TGGCGGAACA ACGAACCTGA CCACCAATAC CGCTGCGCTC 
AGCGGAACCA GCACCGCCAA TCCGGTGATC AAGATCACGC AGTGGGACGC GCTGTATGCG 
GGTCTGCCTG GGGTTACCCC TCTTCTAAAA GAGTTCGACT TCTACGACGC ACGCTATCCC 
GGAACGGAAG GCCCCGCGGG CGGTATCGAC ATTGCCTATG GTCCAGACCT GCGAAACGTC 
ACCACGGACA CAGACCTGGG CAGTTTTAGC TATGCCATGA TTTCCAAGAC CGGCGTTCCC 
TACACCCAGT TTCTCGACTA CGGCCTCCGC ATCATTAATG TCGGTTCGAG CAATTTTGAA 
TTTGTCGTCG GCGGCGCAAT CTTCACCAAC GCAGTGCCGA CCTCTGCCAC TCCGATCGTT 
CCGGTTATAA GTTTGCCGCG CTCCGTAACC GTGGATGGCA AAGATTTCCT GAGCGACCAG 
ACCAACATTT CGTTGAGCCC ACAAATCTCG TGGTCCACTC CGTCGACGGG CACTCCAACG 
TCGTACGCTT TGTACGTCTA CGACACAAGC AAGTTCAACG CGATCGCGTC GTTTTATACC 
AATGGAAACA GCGTGACTGT GCCGGCCGGG ATGCTGCACG CCGGCTCCAC CTACATCTTT 
TATTTGGAGG CTTTCCTGTC CCAGAGTACG ACGTTTGCAA CAGCGCCGTT TCGCACAGGA 
ACCAGCCAGG CAATCTCGTT TGTCGTTTCC GGCATAATGA CCACGGCCGG AGGCGCCAGT 
GCGTCAGGCG TGCCCTCCGA GACGAAACAG AAGTTTAGGG TTACGCCTCG TTTCGTGGGA 
GCACCGAAGG TTGCAAAGCA ATAG

Protein sequence

MPYPASVFGP AVRNQVLRSL LLIALIPAAL FLSACGGSSS STTATTGVAP VFTSTAPTIA 
REGVLYTYDV TTTTSDGSTV TYAATTVPSG ATFDGATLKW TPTHAESRIS NSFTITATTS 
NNGTATQFFS VTPNGNIDGT AVDHAVTGSG LKNYNQDLSG SVVEALVPDG KGGYNTVRGS 
GKDDGTFSVG NIGTGSFWLH VQQPEVGTLQ DNYIWTNASD VDLGMLLGQR PDVVQEKLGQ 
TITTSFDLAV APKSEDSLAW ASPDAGAFGN GLPTSFTQHL VSTFPQSGGL IDSAKGDRGF 
FVHYSPTSTG LGVAVDAAEY DSITQTDGGT TNLTTNTAAL SGTSTANPVI KITQWDALYA 
GLPGVTPLLK EFDFYDARYP GTEGPAGGID IAYGPDLRNV TTDTDLGSFS YAMISKTGVP 
YTQFLDYGLR IINVGSSNFE FVVGGAIFTN AVPTSATPIV PVISLPRSVT VDGKDFLSDQ 
TNISLSPQIS WSTPSTGTPT SYALYVYDTS KFNAIASFYT NGNSVTVPAG MLHAGSTYIF 
YLEAFLSQST TFATAPFRTG TSQAISFVVS GIMTTAGGAS ASGVPSETKQ KFRVTPRFVG 
APKVAKQ