Gene Information Plasmid Coverage information Fosmid Coverage information Sequence |
Gene Information |
Locus tag | BcerKBAB4_3477 |
Symbol | |
ID | 5843689 |
Type | CDS |
Is gene spliced | No |
Is pseudo gene | No |
Organism name | Bacillus weihenstephanensis KBAB4 |
Kingdom | Bacteria |
Replicon accession | NC_010184 |
Strand | + |
Start bp | 3526858 |
End bp | 3529668 |
Gene Length | 2811 bp |
Protein Length | 936 aa |
Translation table | 11 |
GC content | 50% |
IMG OID | 641378600 |
Product | triple helix repeat-containing collagen |
Protein accession | YP_001646278 |
Protein GI | 163941394 |
COG category | |
COG ID | |
TIGRFAM ID | |
|
|
Plasmid Coverage information |
Num covering plasmid clones | 1 |
Plasmid unclonability p-value | 0.00171179 |
Plasmid hitchhiking | No |
Plasmid clonability | decreased coverage |
| |
Fosmid Coverage information |
Num covering fosmid clones | n/a |
Fosmid unclonability p-value | n/a |
Fosmid Hitchhiker | n/a |
Fosmid clonability | n/a |
| |
Sequence |
Gene sequence | ATGTCTCGCT TTAACGACAA TCAAAATAAA TACTCCAATC CATGCTTTCC AACTAGCGCT GGACGAATTC CAACTACCCC AACGATTCCA ATTACTAAAG CGCAAATTAG AACATTCCGT GCAATCATTA ACGATTTAAT AAAAATAATC CCTAAACTTT TCGCCAATCC ATCTCCCAAA AACATTGAGA ATCTAATAGA TACATTGCAC CTACTAAGCA AATTCATCTG TTCACTAGAC ACTACTTCCG CTCTGAAAGC ACAAGGATTA GCCATCATTA AAAACTTAAT AACTATATTA AAAAATCCAA CCTTCGTAGC AAGTGCTGTA TTTGTTGAAC TTCAAATTTT AATTAATTAT TTACTTTACA TTACAAAGTT ATTCCGAATT GATCCTTGTA CACTCCAAGA ACTCCTTAAA TTAATTGCAG AGTTACAAAC TACTCTAGTT AATTCAGCTT CGTTCGGCAG AGGACCTACT GGACCTACTG GACCTAGAGG TAACACGGGC GCTACTGGCG CTACCGGACC TAGAGGTAAC ACGGGCGCTA CTGGTGCGAC CGGACCTAGA GGTAACACGG GCGCTACTGG TGCGACCGGA CCTAGAGGTA ACACAGGTGC TACTGGTGCG ACCGGACCTA GAGGTAACAC GGGCGCTACT GGTGCGACCG GACCTAGAGG TAACACAGGT GCTACTGGTG CGACCGGACC TAGAGGTAAC ACGGGCGCTA CTGGTGCGAC CGGACCTAGA GGTAACACGG GCGCTACTGG TGCGACCGGA CCTAGAGGTA ACACGGGCGC TACTGGTGCG ACCGGACCTA GAGGTAACAC AGGTGCTACT GGTGCGATCG GACCTAGAGG TAACACGGGC GCTACTGGTG CGACCGGACC TAGAGGTAAC ACAGGTGCTA CTGGTGCGAC CGGACCTAGA GGTAACACAG GTGCTACTGG TGCGACCGGA CCTAGAGGTA ACACAGGTGC TACTGGTTCC ACTGGACCTC AAGGTGCGCA AGGTAACACG GGTGCTACTG GACCTCAAGG CGTTCAAGGT AACACAGGTG CTACTGGACC TCAAGGTGCG CAAGGTAACA CGGGTGCTAC TGGACCTCAA GGCGTTCAAG GTAACACAGG TGCTACCGGT TCCACTGGAC CTCAAGGTCT TCAAGGTAAC ACAGGTGCTA CCGGTTCCAC CGGACCTCAA GGTGCGCAAG GTAACACAGG TGCTACTGGA CCTCAAGGCG TTCAAGGTAA CACAGGTGCG ACTGGTTCCA CTGGACCTCA AGGTCTTCAA GGTAACACAG GTGCTACTGG TTCCACTGGA CCTCAAGGTC TTCAAGGTAA CACAGGTGCT ACCGGTTCCA CTGGACCTCA AGGTGCGCAA GGTAACACAG GTGCTACTGG ACCTCAAGGC GTTCAAGGTA ACACAGGTGC TACCGGTTCC ACTGGACCTC AAGGCGTTCA AGGTAACACG GGTGCTACCG GTTCCACTGG ACCCCAAGGC GTTCAAGGTA ACACGGGTGC TACTGGACCT CAAGGCGTTC AAGGTAACAC AGGTGCTACT GGTTCCACTG GACCTCAAGG CGTTCAAGGT AACACAGGTG CTACTGGACC TCAAGGTGCT CAAGGTAACA CGGGTGCTAC TGGACCTCAA GGCGTTCAAG GTAACACAGG TGCTACCGGT TCCACTGGAC CTCAAGGCGT TCAAGGTAAC ACAGGTGCTA CTGGACCTCA AGGCGTTCAA GGTAACACAG GTGCTACTGG TTCCACTGGA CCTCAAGGCG TTCAAGGTAA CACAGGTGCT ACTGGACCTC AAGGTGCGCA AGGTAACACG GGTGCTACTG GACCTCAAGG CGTTCAAGGT AACACAGGTG CTACTGGTTC CACTGGACCT CAAGGCGTTC AAGGTAACAC AGGTGCTACC GGACCTCAAG GCACTCAAGG TAATACGGGT GCTACCGGAC CTCAAGGTGC TCAAGGTAAC ACGGGTGCTA CCGGACCTCA AGGTGCTCAA GGTAACACAG GTGCGACTGG TATAGGAGTT ACCGGACCTA CCGGACCTTC TGGTGGGCCT CCTGGACCTA CTGGACCTCA AGGTATTCAA GGTAACACAG GTGCTACCGG ACCTCAAGGT GTTCAAGGTA ACACGGGTGC TACCGGACCT CAAGGTGCTC AAGGTAACAC GGGTGCTACC GGACCTCAAG GTGCTCAAGG TAACACGGGT GCTACCGGAC CTCAAGGTGC TCAAGGTAAC ACAGGTGCTA CCGGACCTCA AGGTGCTCAA GGTAACACAG GTGCGACTGG TATAGGAGTT ACCGGACCTA CTGGACCTCA AGGTAACACG GGTGCGACTG GACCTCAAGG TGTTCAAGGA CCAACGGGTG CGACTGGTAT AGGAGTTACC GGACCTACTG GACCTAGCTT CCCAGTAGCA ACAATCGTTG TAACAAACAA CATCCAACAA ACAGTAATCC AATTTAATAA CTTTATTTTT AGTACTGCAA TTAACGTAAA CAATATTATC TTTAACGGCA CAAATACAGT TACTGTTATT AACGCTGGTA TTTATGTAAT TAGCGTATCT ATTTCTACAA CTGCGCCAGG ATGCGCTCCA CTTGGAGTAG GAATTTCAAT TAATGGAGCA GTTGCTACTG ACAACTTCTC TTCAAATCTA ATAGGCGACT CACTTTCATT TACTACAATC GAAACATTAG CTGCTGGAGC AAACATTTCT GTCCAATCTA CTCTTAACGA GATTACGATC CCTGCAACAG GAAACACTAA CATTCGTCTT ACTGTATTTA GAATCGCTTA A
|
Protein sequence | MSRFNDNQNK YSNPCFPTSA GRIPTTPTIP ITKAQIRTFR AIINDLIKII PKLFANPSPK NIENLIDTLH LLSKFICSLD TTSALKAQGL AIIKNLITIL KNPTFVASAV FVELQILINY LLYITKLFRI DPCTLQELLK LIAELQTTLV NSASFGRGPT GPTGPRGNTG ATGATGPRGN TGATGATGPR GNTGATGATG PRGNTGATGA TGPRGNTGAT GATGPRGNTG ATGATGPRGN TGATGATGPR GNTGATGATG PRGNTGATGA TGPRGNTGAT GAIGPRGNTG ATGATGPRGN TGATGATGPR GNTGATGATG PRGNTGATGS TGPQGAQGNT GATGPQGVQG NTGATGPQGA QGNTGATGPQ GVQGNTGATG STGPQGLQGN TGATGSTGPQ GAQGNTGATG PQGVQGNTGA TGSTGPQGLQ GNTGATGSTG PQGLQGNTGA TGSTGPQGAQ GNTGATGPQG VQGNTGATGS TGPQGVQGNT GATGSTGPQG VQGNTGATGP QGVQGNTGAT GSTGPQGVQG NTGATGPQGA QGNTGATGPQ GVQGNTGATG STGPQGVQGN TGATGPQGVQ GNTGATGSTG PQGVQGNTGA TGPQGAQGNT GATGPQGVQG NTGATGSTGP QGVQGNTGAT GPQGTQGNTG ATGPQGAQGN TGATGPQGAQ GNTGATGIGV TGPTGPSGGP PGPTGPQGIQ GNTGATGPQG VQGNTGATGP QGAQGNTGAT GPQGAQGNTG ATGPQGAQGN TGATGPQGAQ GNTGATGIGV TGPTGPQGNT GATGPQGVQG PTGATGIGVT GPTGPSFPVA TIVVTNNIQQ TVIQFNNFIF STAINVNNII FNGTNTVTVI NAGIYVISVS ISTTAPGCAP LGVGISINGA VATDNFSSNL IGDSLSFTTI ETLAAGANIS VQSTLNEITI PATGNTNIRL TVFRIA
|
| |