Gene Bcer98_3359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcer98_3359
Symbol
ID	5343822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cytotoxicus NVH 391-98
Kingdom	Bacteria
Replicon accession	NC_009674
Strand	-
Start bp	3427995
End bp	3429068
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	39%
IMG OID	640840846
Product	glutamyl aminopeptidase
Protein accession	YP_001376569
Protein GI	152977052
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAG AGACATTAGA GCTATTTCGT ACATTAACAG AACTACAAGG AGCATCAGGA 
TTTGAGCATG ATGTACGTCG CTTTATGAAG CAAGAATTAA GCAAATATGC AGATGAGATT 
GTGCAGGATG GTTTAGGCAG TATATTTGGT CTGAAAAAAG GAGACGAGAG TGGTCCTCGT 
GTACTGGTAG CAGGTCATAT GGATGAAGTT GGCTTCATGG TAACACAAAT TACGGAAAAC 
GGGATGATTC GTTTTCAAAC ATTAGGTGGT TGGTGGAGTC AAGTATTACT AGCTCAGCGT 
GTACAGATTA TGACAAAAAA TGGTCCTATT GTTGGGGTAA TTGGTTCTAT TCCACCGCAT 
TTATTAAGTG ACGCGCAGCG TGCAAAACCA ATGGATATTA AGAATATGTT AATTGATATT 
GGTGCTGACA GCTATGAAGA AGCACTTGAA ATCGGTGTGA AACCAGGGCA ACAAATTGTT 
CCAATTTGTC CGTTTACACC GATGGCAAAT GAGAAGAAAA TTATGGCGAA AGCTTGGGAC 
AACCGTTATG GTTGTGGTTT GGCAATTGAA TTATTAAAAG AATTAAAGGA TGAAACTTTG 
CCAAATATAT TATATTCTGG TGCAACTGTT CAAGAAGAAG TAGGACTTCG TGGTGCACAA 
ACAGCTGCGA ATATGATTCA GCCGGATATT TTCTATGCGC TTGATGCAAG TCCAGCGAAT 
GATGCATCTG GTGATAAAGA GCAGTTCGGA CAATTAGGAA AAGGGGCGCT TCTTCGTATT 
TATGACCGCA CAATGGTAAC ACATCGCGGG ATGCGTGAAT TTATTTTAGA TACAGCAGAA 
ACACATAATA TTCCGTATCA ATATTTTATT TCACAAGGTG GTACAGATGC AGGACGTGTA 
CATACAAGCA ACTCCGGTAT TCCATCAGCA GTAATCGGTG TTTGTGCTCG TTATATTCAT 
ACACACGCTT CAATTTTACA TGTTGATGAT TATGCGGCGG CAAAAGAATT ATTGATGAAG 
CTTGTTAAAG CGACAGATAA AACGACGCTG GAAACAATTA AAAATAGTGC GTAA

Protein sequence

MNKETLELFR TLTELQGASG FEHDVRRFMK QELSKYADEI VQDGLGSIFG LKKGDESGPR 
VLVAGHMDEV GFMVTQITEN GMIRFQTLGG WWSQVLLAQR VQIMTKNGPI VGVIGSIPPH 
LLSDAQRAKP MDIKNMLIDI GADSYEEALE IGVKPGQQIV PICPFTPMAN EKKIMAKAWD 
NRYGCGLAIE LLKELKDETL PNILYSGATV QEEVGLRGAQ TAANMIQPDI FYALDASPAN 
DASGDKEQFG QLGKGALLRI YDRTMVTHRG MREFILDTAE THNIPYQYFI SQGGTDAGRV 
HTSNSGIPSA VIGVCARYIH THASILHVDD YAAAKELLMK LVKATDKTTL ETIKNSA