Gene Information Plasmid Coverage information Fosmid Coverage information Sequence |
Gene Information |
Locus tag | BCZK3469 |
Symbol | |
ID | 3024683 |
Type | CDS |
Is gene spliced | No |
Is pseudo gene | No |
Organism name | Bacillus cereus E33L |
Kingdom | Bacteria |
Replicon accession | NC_006274 |
Strand | + |
Start bp | 3593909 |
End bp | 3596155 |
Gene Length | 2247 bp |
Protein Length | 748 aa |
Translation table | 11 |
GC content | 53% |
IMG OID | 637547686 |
Product | triple helix repeat-containing collagen |
Protein accession | YP_085052 |
Protein GI | 52141777 |
COG category | [S] Function unknown |
COG ID | [COG4886] Leucine-rich repeat (LRR) protein |
TIGRFAM ID | |
|
|
Plasmid Coverage information |
Num covering plasmid clones | 15 |
Plasmid unclonability p-value | 1 |
Plasmid hitchhiking | No |
Plasmid clonability | normal |
| |
Fosmid Coverage information |
Num covering fosmid clones | n/a |
Fosmid unclonability p-value | n/a |
Fosmid Hitchhiker | n/a |
Fosmid clonability | n/a |
| |
Sequence |
Gene sequence | ATGTCTCGTT ATGACGACAG TCAAAACAAA TTCTCCAAAC CATGCTTTCC AAGTAGCGCC GGACGAATCC CGAATACCCC ATCAATCCCA GTTACTAAGG CACAACTTAG AACATTTCGC GCAATCATTA TTGATTTAAC AAAAATAATC CCAAAACTTT TCGCAAATCC ATCTCCCCAA AATATTGAAG ATCTAATCGA TACATTGAAC CTACTAAGTA AATTTATTTG TTCACTAGAC GCTGCTTCCT CCCTGAAAGC ACAAGGGTTA GCTATTATTA AAAACTTAAT AACTATATTA AAAAACCCAA CTTTCGTAGC AAGCGCTGTA TTTATCGAGC TTCAAAATCT AATTAATTTT TTACTATCCA TTACAAAACT ATTCCGAATT GACCCTTGCA CACTTCAAGA GCTTCTTAAA TTAATCGCAG CATTACAAAC CGCTTTAGTT AATTCTGCTT CATTCATTCA AGGACCTACT GGACCTACTG GGCCAGCTGG TGCTACTGGC GCCACTGGAC CTCAAGGTGC TCAAGGTAAC ACAGGTGCTA CTGGTGCCAC TGGACCTCAA GGTGCTCAAG GTAACACAGG TGCTACTGGT GCCACTGGAC CTCAAGGTGC TCAAGGTAAC ACAGGTGCTA CTGGTGCCAC TGGACCTCAA GGTGCTCAAG GTAACACAGG TGCTACTGGT GCCACTGGAC CTCAAGGTGT TCAAGGTAAC ACGGGCGCTA CTGGTGCCAC TGGACCTCAA GGTGCTCAAG GTAACACAGG TGCTACTGGT GCCACTGGAC CTCAAGGCGC TCAAGGTAAC ACAGGTGCTA CTGGACCTCA GGGTGCTCAA GGTAACACGG GCGCTACTGG ACCTCAGGGT GTTCAAGGTA ACACGGGCGC TACTGGTGCC ACTGGACCTC AAGGTGCTCA AGGTAACACA GGTGCTACTG GTGCCACTGG ACCTCAGGGT GCTCAAGGTA ACACGGGCGC TACTGGACCT CAAGGCGCTC AAGGACCAGC GGGTGTTACT GGCGCTACTG GACCTCAAGG TGCTCAAGGT AACACGGGTG CTACTGGACC TCAAGGCGCT CAAGGACCAG CGGGTGCTAC TGGCGCTACT GGACCTCAAG GTGCTCAAGG TAACACAGGT GCTACTGGAC CTCAGGGTAT TCAAGGTAAC ACGGGCGCTA CTGGTGCTAC CGGCATAGGA GTTACCGGAC CTACTGGGCC TTCTGGTGGG CCTCCTGGAC CTACTGGACC TCAAGGTAAC ACAGGTGCTA CTGGTGCCAC TGGACCTCAA GGTGTTCAAG GTAACACGGG CGCTACTGGT GCCACTGGAC CTCAAGGTGT TCAAGGACCA GCAGGTGCCA CTGGACCTCA AGGCGCTCAA GGACCAGCGG GTGCTACTGG CGCTACTGGA CCTCAAGGCG TTCAAGGTAA CACAGGTGCT ACTGGTGCCA CTGGACCTCA AGGCGCTCAA GGACCAGCAG GTGCTACTGG TGCCACTGGA CCTCAAGGCG TTCAAGGTAA CACGGGTGCT ACTGGTGCCA CTGGACCTCA AGGTGTTCAA GGACCAGCAG GTGCCACTGG ACCTCAAGGT GTTCAAGGAC CAGCAGGTGC CACTGGACCT CAAGGCGCTC AAGGTAACAC AGGTGCTACT GGTGCTACTG GACCTCAGGG TGTTCAAGGA CCAGCAGGTG CTACTGGACC TCAGGGTGTT CAAGGACCAG CGGGTGCTAC CGGTGCCACT GGACCTCAAG GTGTTCAAGG TAACACAGGT GCTACTGGTG CCACTGGACC TCAGGGTGTT CAAGGACCAG CGGGTGCTAC TGGTGCTACT GGACCTCAGG GTGTTCAAGG ACCAGCGGGT GCTACCGGTG CCACTGGACC TCAAGGTGTT CAAGGTAACA CAGGTGCTAC TGGTGCCACT GGACCTCAAG GTGCTCAAGG TAACACGGGC GCTACTGGTG CCACTGGACC TCAAGGTGTT CAAGGACCAG CAGGTGCTAC TGGACCTCAA GGTGTTCAAG GGCCAGCAGG TGCTACCGGT GCCACTGGAC CTCAAGGTGT TCAAGGTAAC ACGGGTGCTA CTGGTGCCAC TGGACCTCAA GGTGCTCAAG GTACACGGCG CTACTGGTGC CACTGGACCT CAAGGTGTTC AAGGACCAGC AGGTGCTACT GGTGCTACTG GACCTCAAGG TGTTCAAGGT CCTGCAGGTG CTACTGGTGC CACTGGACCT CAAGGTGTTC AAGGTAA
|
Protein sequence | MSRYDDSQNK FSKPCFPSSA GRIPNTPSIP VTKAQLRTFR AIIIDLTKII PKLFANPSPQ NIEDLIDTLN LLSKFICSLD AASSLKAQGL AIIKNLITIL KNPTFVASAV FIELQNLINF LLSITKLFRI DPCTLQELLK LIAALQTALV NSASFIQGPT GPTGPAGATG ATGPQGAQGN TGATGATGPQ GAQGNTGATG ATGPQGAQGN TGATGATGPQ GAQGNTGATG ATGPQGVQGN TGATGATGPQ GAQGNTGATG ATGPQGAQGN TGATGPQGAQ GNTGATGPQG VQGNTGATGA TGPQGAQGNT GATGATGPQG AQGNTGATGP QGAQGPAGVT GATGPQGAQG NTGATGPQGA QGPAGATGAT GPQGAQGNTG ATGPQGIQGN TGATGATGIG VTGPTGPSGG PPGPTGPQGN TGATGATGPQ GVQGNTGATG ATGPQGVQGP AGATGPQGAQ GPAGATGATG PQGVQGNTGA TGATGPQGAQ GPAGATGATG PQGVQGNTGA TGATGPQGVQ GPAGATGPQG VQGPAGATGP QGAQGNTGAT GATGPQGVQG PAGATGPQGV QGPAGATGAT GPQGVQGNTG ATGATGPQGV QGPAGATGAT GPQGVQGPAG ATGATGPQGV QGNTGATGAT GPQGAQGNTG ATGATGPQGV QGPAGATGPQ GVQGPAGATG ATGPQGVQGN TGATGATGPQ GAQGTRRYWC HWTSRCSRTS RCYWCYWTSR CSRSCRCYWC HWTSRCSR
|
| |