Gene BCZK3470 details

Gene Information       Plasmid Coverage information       Fosmid Coverage information       Sequence       

Gene Information

Locus tagBCZK3470 
Symbol 
ID3026520 
TypeCDS 
Is gene splicedNo 
Is pseudo geneNo 
Organism nameBacillus cereus E33L 
KingdomBacteria 
Replicon accessionNC_006274 
Strand
Start bp3595134 
End bp3597575 
Gene Length2442 bp 
Protein Length813 aa 
Translation table11 
GC content55% 
IMG OID637547687 
Producttriple helix repeat-containing collagen 
Protein accessionYP_085053 
Protein GI52141776 
COG category 
COG ID 
TIGRFAM ID 


Plasmid Coverage information

Num covering plasmid clones
Plasmid unclonability p-value0.943395 
Plasmid hitchhikingNo 
Plasmid clonabilitynormal 
 

Fosmid Coverage information

Num covering fosmid clonesn/a 
Fosmid unclonability p-valuen/a 
Fosmid Hitchhikern/a 
Fosmid clonabilityn/a 
 

Sequence

Gene sequence
GTGGGCCTCC TGGACCTACT GGACCTCAAG GTAACACAGG TGCTACTGGT GCCACTGGAC 
CTCAAGGTGT TCAAGGTAAC ACGGGCGCTA CTGGTGCCAC TGGACCTCAA GGTGTTCAAG
GACCAGCAGG TGCCACTGGA CCTCAAGGCG CTCAAGGACC AGCGGGTGCT ACTGGCGCTA
CTGGACCTCA AGGCGTTCAA GGTAACACAG GTGCTACTGG TGCCACTGGA CCTCAAGGCG
CTCAAGGACC AGCAGGTGCT ACTGGTGCCA CTGGACCTCA AGGCGTTCAA GGTAACACGG
GTGCTACTGG TGCCACTGGA CCTCAAGGTG TTCAAGGACC AGCAGGTGCC ACTGGACCTC
AAGGTGTTCA AGGACCAGCA GGTGCCACTG GACCTCAAGG CGCTCAAGGT AACACAGGTG
CTACTGGTGC TACTGGACCT CAGGGTGTTC AAGGACCAGC AGGTGCTACT GGACCTCAGG
GTGTTCAAGG ACCAGCGGGT GCTACCGGTG CCACTGGACC TCAAGGTGTT CAAGGTAACA
CAGGTGCTAC TGGTGCCACT GGACCTCAGG GTGTTCAAGG ACCAGCGGGT GCTACTGGTG
CTACTGGACC TCAGGGTGTT CAAGGACCAG CGGGTGCTAC CGGTGCCACT GGACCTCAAG
GTGTTCAAGG TAACACAGGT GCTACTGGTG CCACTGGACC TCAAGGTGCT CAAGGTAACA
CGGGCGCTAC TGGTGCCACT GGACCTCAAG GTGTTCAAGG ACCAGCAGGT GCTACTGGAC
CTCAAGGTGT TCAAGGGCCA GCAGGTGCTA CCGGTGCCAC TGGACCTCAA GGTGTTCAAG
GTAACACGGG TGCTACTGGT GCCACTGGAC CTCAAGGTGC TCAAGGTACA CGGCGCTACT
GGTGCCACTG GACCTCAAGG TGTTCAAGGA CCAGCAGGTG CTACTGGTGC TACTGGACCT
CAAGGTGTTC AAGGTCCTGC AGGTGCTACT GGTGCCACTG GACCTCAAGG TGTTCAAGGT
AACACAGGTG CTACTGGTGC CACTGGACCT CAAGGTGCTC AAGGTAACAC GGGCGCTACT
GGTGCCACTG GACCTCAAGG TGTTCAAGGA CCAGCAGGTG CTACTGGACC TCAAGGTGTT
CAAGGGCCAG CAGGTGCTAC CGGTGCCACT GGACCTCAAG GTGTTCAAGG TAACACGGGT
GCTACTGGTG CCACTGGACC TCAAGGTGCT CAAGGTAACA CGGGCGCTAC TGGTGCCACT
GGACCTCAAG GTGTTCAAGG ACCAGCAGGT GCTACTGGAC CTCAAGGTGT TCAAGGGCCA
GCAGGTGCTA CTGGACCTCA AGGTGTTCAA GGTAACACGG GTGCTACTGG TGCCACTGGA
CCTCAAGGTG CTCAAGGTAA CACGGGCGCT ACTGGTGCCA CTGGACCTCA AGGTGTTCAA
GGACCAGCAG GCGCTACCGG TGCTACTGGA CCTCAAGGTG CTCAAGGACC AGCAGGTGCT
ACCGGTGCCA CTGGATCTCA AGGCGTTCAA GGACCAGCAG GTGCTACCGG TGCCACTGGA
CCTCAAGGTG TTCAAGGACC AGCAGGTGCT ACTGGACCTC AAGGTGCTCA AGGACCAGCA
GGTGCTACTG GACCTCAAGG TGCTCAAGGA CCAGCAGGTG CTACTGGACC TCAAGGTGCT
CAAGGACCAG CAGGTGCTAC TGGTGCCACT GGACCTCAAG GTATTCAAGG ACCAGCAGGT
GCCACTGGCG CTACTGGACC TCAAGGCGTT CAAGGGCCAA CGGGTGCTAC TGGTATAGGA
GTTACCGGAC CTACTGGGCC TTCTGGTGGG CCTCCTGGAC CTACTGGACC TCAGGGACCT
CAAGGTAATA CAGGTGCTAC TGGACCTCAA GGTATTCAAG GGCCTGCTGG TGCTACTGGT
GCCACTGGAC CTCAAGGTAC TCAAGGACCG GCTGGTGCTA CCGGCGCTAC TGGACCTCAA
GGTGTTCAAG GGCCAACGGG TGCTACTGGT ATAGGAGTTA CCGGACCTAC TGGGCCTTCT
GGACCTAGCT TCCCTGTAGC AACAATTGTT GTAACAAACA ACATTCAACA AACAGTACTC
CAATTTAACA ACTTCATTTT TAATACTGCA ATTAACGTAA ACAACATTAT CTTCAACGGC
ACAGATACAG TTACTGTTAT CAACGCTGGT ATTTATGTCA TTAGCGTATC CATCTCTACA
ACTGCACCAG GATGTGCACC ACTCGGAGTA GGAATTTCAA TAAATGGAGC AGTCGCAACT
GACAACTTCT CTTCAAATCT AATAGGCGAC TCACTTTCAT TCACTACGAT CGAAACGTTA
ACTGCCGGCG CGAACATTTC TGTCCAATCC ACTCTTAATG AGATTACGAT CCCTGCAACA
GGAAACACTA ATATTCGTCT AACTGTATTT AGAATCGCTT AA
 
Protein sequence
MGLLDLLDLK VTQVLLVPLD LKVFKVTRAL LVPLDLKVFK DQQVPLDLKA LKDQRVLLAL 
LDLKAFKVTQ VLLVPLDLKA LKDQQVLLVP LDLKAFKVTR VLLVPLDLKV FKDQQVPLDL
KVFKDQQVPL DLKALKVTQV LLVLLDLRVF KDQQVLLDLR VFKDQRVLPV PLDLKVFKVT
QVLLVPLDLR VFKDQRVLLV LLDLRVFKDQ RVLPVPLDLK VFKVTQVLLV PLDLKVLKVT
RALLVPLDLK VFKDQQVLLD LKVFKGQQVL PVPLDLKVFK VTRVLLVPLD LKVLKVHGAT
GATGPQGVQG PAGATGATGP QGVQGPAGAT GATGPQGVQG NTGATGATGP QGAQGNTGAT
GATGPQGVQG PAGATGPQGV QGPAGATGAT GPQGVQGNTG ATGATGPQGA QGNTGATGAT
GPQGVQGPAG ATGPQGVQGP AGATGPQGVQ GNTGATGATG PQGAQGNTGA TGATGPQGVQ
GPAGATGATG PQGAQGPAGA TGATGSQGVQ GPAGATGATG PQGVQGPAGA TGPQGAQGPA
GATGPQGAQG PAGATGPQGA QGPAGATGAT GPQGIQGPAG ATGATGPQGV QGPTGATGIG
VTGPTGPSGG PPGPTGPQGP QGNTGATGPQ GIQGPAGATG ATGPQGTQGP AGATGATGPQ
GVQGPTGATG IGVTGPTGPS GPSFPVATIV VTNNIQQTVL QFNNFIFNTA INVNNIIFNG
TDTVTVINAG IYVISVSIST TAPGCAPLGV GISINGAVAT DNFSSNLIGD SLSFTTIETL
TAGANISVQS TLNEITIPAT GNTNIRLTVF RIA