Gene Information Plasmid Coverage information Fosmid Coverage information Sequence |
Gene Information |
Locus tag | BCZK3470 |
Symbol | |
ID | 3026520 |
Type | CDS |
Is gene spliced | No |
Is pseudo gene | No |
Organism name | Bacillus cereus E33L |
Kingdom | Bacteria |
Replicon accession | NC_006274 |
Strand | + |
Start bp | 3595134 |
End bp | 3597575 |
Gene Length | 2442 bp |
Protein Length | 813 aa |
Translation table | 11 |
GC content | 55% |
IMG OID | 637547687 |
Product | triple helix repeat-containing collagen |
Protein accession | YP_085053 |
Protein GI | 52141776 |
COG category | |
COG ID | |
TIGRFAM ID | |
|
|
Plasmid Coverage information |
Num covering plasmid clones | 7 |
Plasmid unclonability p-value | 0.943395 |
Plasmid hitchhiking | No |
Plasmid clonability | normal |
| |
Fosmid Coverage information |
Num covering fosmid clones | n/a |
Fosmid unclonability p-value | n/a |
Fosmid Hitchhiker | n/a |
Fosmid clonability | n/a |
| |
Sequence |
Gene sequence | GTGGGCCTCC TGGACCTACT GGACCTCAAG GTAACACAGG TGCTACTGGT GCCACTGGAC CTCAAGGTGT TCAAGGTAAC ACGGGCGCTA CTGGTGCCAC TGGACCTCAA GGTGTTCAAG GACCAGCAGG TGCCACTGGA CCTCAAGGCG CTCAAGGACC AGCGGGTGCT ACTGGCGCTA CTGGACCTCA AGGCGTTCAA GGTAACACAG GTGCTACTGG TGCCACTGGA CCTCAAGGCG CTCAAGGACC AGCAGGTGCT ACTGGTGCCA CTGGACCTCA AGGCGTTCAA GGTAACACGG GTGCTACTGG TGCCACTGGA CCTCAAGGTG TTCAAGGACC AGCAGGTGCC ACTGGACCTC AAGGTGTTCA AGGACCAGCA GGTGCCACTG GACCTCAAGG CGCTCAAGGT AACACAGGTG CTACTGGTGC TACTGGACCT CAGGGTGTTC AAGGACCAGC AGGTGCTACT GGACCTCAGG GTGTTCAAGG ACCAGCGGGT GCTACCGGTG CCACTGGACC TCAAGGTGTT CAAGGTAACA CAGGTGCTAC TGGTGCCACT GGACCTCAGG GTGTTCAAGG ACCAGCGGGT GCTACTGGTG CTACTGGACC TCAGGGTGTT CAAGGACCAG CGGGTGCTAC CGGTGCCACT GGACCTCAAG GTGTTCAAGG TAACACAGGT GCTACTGGTG CCACTGGACC TCAAGGTGCT CAAGGTAACA CGGGCGCTAC TGGTGCCACT GGACCTCAAG GTGTTCAAGG ACCAGCAGGT GCTACTGGAC CTCAAGGTGT TCAAGGGCCA GCAGGTGCTA CCGGTGCCAC TGGACCTCAA GGTGTTCAAG GTAACACGGG TGCTACTGGT GCCACTGGAC CTCAAGGTGC TCAAGGTACA CGGCGCTACT GGTGCCACTG GACCTCAAGG TGTTCAAGGA CCAGCAGGTG CTACTGGTGC TACTGGACCT CAAGGTGTTC AAGGTCCTGC AGGTGCTACT GGTGCCACTG GACCTCAAGG TGTTCAAGGT AACACAGGTG CTACTGGTGC CACTGGACCT CAAGGTGCTC AAGGTAACAC GGGCGCTACT GGTGCCACTG GACCTCAAGG TGTTCAAGGA CCAGCAGGTG CTACTGGACC TCAAGGTGTT CAAGGGCCAG CAGGTGCTAC CGGTGCCACT GGACCTCAAG GTGTTCAAGG TAACACGGGT GCTACTGGTG CCACTGGACC TCAAGGTGCT CAAGGTAACA CGGGCGCTAC TGGTGCCACT GGACCTCAAG GTGTTCAAGG ACCAGCAGGT GCTACTGGAC CTCAAGGTGT TCAAGGGCCA GCAGGTGCTA CTGGACCTCA AGGTGTTCAA GGTAACACGG GTGCTACTGG TGCCACTGGA CCTCAAGGTG CTCAAGGTAA CACGGGCGCT ACTGGTGCCA CTGGACCTCA AGGTGTTCAA GGACCAGCAG GCGCTACCGG TGCTACTGGA CCTCAAGGTG CTCAAGGACC AGCAGGTGCT ACCGGTGCCA CTGGATCTCA AGGCGTTCAA GGACCAGCAG GTGCTACCGG TGCCACTGGA CCTCAAGGTG TTCAAGGACC AGCAGGTGCT ACTGGACCTC AAGGTGCTCA AGGACCAGCA GGTGCTACTG GACCTCAAGG TGCTCAAGGA CCAGCAGGTG CTACTGGACC TCAAGGTGCT CAAGGACCAG CAGGTGCTAC TGGTGCCACT GGACCTCAAG GTATTCAAGG ACCAGCAGGT GCCACTGGCG CTACTGGACC TCAAGGCGTT CAAGGGCCAA CGGGTGCTAC TGGTATAGGA GTTACCGGAC CTACTGGGCC TTCTGGTGGG CCTCCTGGAC CTACTGGACC TCAGGGACCT CAAGGTAATA CAGGTGCTAC TGGACCTCAA GGTATTCAAG GGCCTGCTGG TGCTACTGGT GCCACTGGAC CTCAAGGTAC TCAAGGACCG GCTGGTGCTA CCGGCGCTAC TGGACCTCAA GGTGTTCAAG GGCCAACGGG TGCTACTGGT ATAGGAGTTA CCGGACCTAC TGGGCCTTCT GGACCTAGCT TCCCTGTAGC AACAATTGTT GTAACAAACA ACATTCAACA AACAGTACTC CAATTTAACA ACTTCATTTT TAATACTGCA ATTAACGTAA ACAACATTAT CTTCAACGGC ACAGATACAG TTACTGTTAT CAACGCTGGT ATTTATGTCA TTAGCGTATC CATCTCTACA ACTGCACCAG GATGTGCACC ACTCGGAGTA GGAATTTCAA TAAATGGAGC AGTCGCAACT GACAACTTCT CTTCAAATCT AATAGGCGAC TCACTTTCAT TCACTACGAT CGAAACGTTA ACTGCCGGCG CGAACATTTC TGTCCAATCC ACTCTTAATG AGATTACGAT CCCTGCAACA GGAAACACTA ATATTCGTCT AACTGTATTT AGAATCGCTT AA
|
Protein sequence | MGLLDLLDLK VTQVLLVPLD LKVFKVTRAL LVPLDLKVFK DQQVPLDLKA LKDQRVLLAL LDLKAFKVTQ VLLVPLDLKA LKDQQVLLVP LDLKAFKVTR VLLVPLDLKV FKDQQVPLDL KVFKDQQVPL DLKALKVTQV LLVLLDLRVF KDQQVLLDLR VFKDQRVLPV PLDLKVFKVT QVLLVPLDLR VFKDQRVLLV LLDLRVFKDQ RVLPVPLDLK VFKVTQVLLV PLDLKVLKVT RALLVPLDLK VFKDQQVLLD LKVFKGQQVL PVPLDLKVFK VTRVLLVPLD LKVLKVHGAT GATGPQGVQG PAGATGATGP QGVQGPAGAT GATGPQGVQG NTGATGATGP QGAQGNTGAT GATGPQGVQG PAGATGPQGV QGPAGATGAT GPQGVQGNTG ATGATGPQGA QGNTGATGAT GPQGVQGPAG ATGPQGVQGP AGATGPQGVQ GNTGATGATG PQGAQGNTGA TGATGPQGVQ GPAGATGATG PQGAQGPAGA TGATGSQGVQ GPAGATGATG PQGVQGPAGA TGPQGAQGPA GATGPQGAQG PAGATGPQGA QGPAGATGAT GPQGIQGPAG ATGATGPQGV QGPTGATGIG VTGPTGPSGG PPGPTGPQGP QGNTGATGPQ GIQGPAGATG ATGPQGTQGP AGATGATGPQ GVQGPTGATG IGVTGPTGPS GPSFPVATIV VTNNIQQTVL QFNNFIFNTA INVNNIIFNG TDTVTVINAG IYVISVSIST TAPGCAPLGV GISINGAVAT DNFSSNLIGD SLSFTTIETL TAGANISVQS TLNEITIPAT GNTNIRLTVF RIA
|
| |