Gene Acid345_2120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2120
Symbol
ID	4069546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2534841
End bp	2536442
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	57%
IMG OID	637984135
Product	hypothetical protein
Protein accession	YP_591195
Protein GI	94969147
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.981673
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCAACAAT TCAGGAAGAT TCTCGCTCTT GTAGTGCTTG CGAGCGCGGC GACCTTTGTT 
CTCGCGCAGG ATGAAAGCCT GGGCGACGCA GCGCGCAAAG TTCGCGACAA CAAGAAAGAT 
GATGTCCAGG TGAACAAGGA CGACGCCAAG GAACTCTTCC AGTCGATGAA CAAGATCATG 
ACGTTTGCCA GCGCGGACAG CGGCTTCGGG CGGCGGACCG CGGTGAACCA CAAGATGCTG 
GGGCGTCCAG ACGTGGAAAA GCATTTCAAC GACAGCCTGC AGGAGGAAGT GAAGAAGCAA 
AGGCTGGCGG AGTCGCAGGT TGTGCTGCAA AAGTTTGGTC TTTTGCCGGG CGATTTCAAC 
CTGGAAACTT TCCTTGAGAA GAACACAGCG AAAGCGCTCG GTGGATTTTA CGATCCGCGC 
GACAAGACGA TGTATCTCCT GAACTGGATC CCACTCGATC GGCAGAAGGA CATCATGGCG 
CATGAGTTGA CCCATGCGCT GCAGGACCAG AATTACAACA TCATGAAGTT CGAGGGTTGG 
GACCCGAAGC AGGCGGACGC GAGCACCGTG AAGATGTCTG TGGACGACGA GGATGGTGAG 
CGGCAGACGA CGCGGCGTGC GGTGATAGAG GGGCAAGCCG AAGTCGTACA TTACGATTAC 
ATCCTGCAGC CCTACAGCCT GAGCTTGTCA GATGGATCCG GCGCTCTGGA ATTGATCCAG 
GACGCGATTC GGATGAGCTA CGACAACGCA GTTGTATTCA AAATCGCACC CAGGCTGCTC 
CGCGACACAT CATTCTTTCC ATATCGTGAA GGGTTCAACT TTGAACTCGA ACTGTTGAAG 
AAGGGCGGAC GAAGCATGGC CTTTTCGACC CCGTATTCGC GCCCGCCGCA CGGTACGCAC 
GAAGTGCTTC AGCCTGAGAC GTACATGAGT GGAACCCATG TGGCGCCGGT GAAGATTCCA 
GACCTGTCGT CATATCTCGG AAGCGCGTAC GAGGCCTACG ACTCAGGTTC GATGGGCGAG 
CTCGATGTCC AAGTAATGGC GCAGGAATTC GGCATTGAGA ACGATGTCTA TACGGTGGCG 
CGGAAGTGGA ACGGAGGAGC GTACCTCGCT CTGAAGAAGA CATCGCATCC CAAAGATCAG 
CCGATGACAA CCTCGGACCT GGCGCTGGTG TACCTGTCGA AATGGGGCAC TGAAAAGGCC 
GCCACGCGCA TGGCCCAGAT TTATCTCGAC GCGCTCGGTA AGCGGGTGCA GATCACGGAA 
GCGCCGACCA TCACCACGCA TGATTGCGAA GCCGCCAAGT GTCCGACCGC GCTGTGGGAG 
GCGCACCTGA AGACGGCGGA CGGGCCGGTG AACCTGGAGG TATGGCCGAA GGCGACCCTA 
CTGATCACCG AATCGCTGGA CGATGACATG GTGTCGAAGC TACGGGTTCC GCTGCTCGCG 
CCCCCGACGA AGAAGGGTGC GGCGGCTCAG GTTAAAACGC CTTACGGAAC GGACGAGTTG 
GCAATGCGTC TTTACGATGA CTCTCGCTTC GCAGATTTGG CAGAAAGCGT GGCCGCGGAG 
ATTGCAGCCC ACGCCGCCGA ACGGCTACAG AAAATACATT GA

Protein sequence

MQQFRKILAL VVLASAATFV LAQDESLGDA ARKVRDNKKD DVQVNKDDAK ELFQSMNKIM 
TFASADSGFG RRTAVNHKML GRPDVEKHFN DSLQEEVKKQ RLAESQVVLQ KFGLLPGDFN 
LETFLEKNTA KALGGFYDPR DKTMYLLNWI PLDRQKDIMA HELTHALQDQ NYNIMKFEGW 
DPKQADASTV KMSVDDEDGE RQTTRRAVIE GQAEVVHYDY ILQPYSLSLS DGSGALELIQ 
DAIRMSYDNA VVFKIAPRLL RDTSFFPYRE GFNFELELLK KGGRSMAFST PYSRPPHGTH 
EVLQPETYMS GTHVAPVKIP DLSSYLGSAY EAYDSGSMGE LDVQVMAQEF GIENDVYTVA 
RKWNGGAYLA LKKTSHPKDQ PMTTSDLALV YLSKWGTEKA ATRMAQIYLD ALGKRVQITE 
APTITTHDCE AAKCPTALWE AHLKTADGPV NLEVWPKATL LITESLDDDM VSKLRVPLLA 
PPTKKGAAAQ VKTPYGTDEL AMRLYDDSRF ADLAESVAAE IAAHAAERLQ KIH